Incorporating Linguistic Constraints into Keyphrase Generation Inkorporeer Linguistiese Beheinings in Sleutelfrase Generasie የፊደል ቅርጽ ምርጫዎች دمج القيود اللغوية في إنشاء عبارة Keyphrase Q캼sqa-s칬zl톛rin M톛xluqat캼na Linguistik Q캼sqa Q캼sqa Qurulmas캼 Включване на езикови ограничения в генерирането на ключови фрази কীবোর্ড প্রজন্মে লিঙ্গিস্টিক কনস্ট্রেন্ট অন্তর্ভুক্ত করা হচ্ছে ནང་དུ་མཐོ་ཚིག་ལུས་པའི་སྐད་རིགས་དབྱིབས་བཟོ་བཅོས་པ Uključujući Lingističke ograničenje u Generaciju ključne fraze Incorporar restriccions lingüístiques a la generació de frases clau Začlenění jazykových omezení do generování klíčových frází Inddragelse af sproglige begrænsninger i nøglesætningsgenerering Einbeziehung sprachlicher Einschränkungen in die Keyphrasen-Generierung Ενσωμάτωση γλωσσικών περιορισμών στη δημιουργία λέξεων-κλειδιών Incorporar restricciones lingüísticas en la generación de frases clave Keelepiirangute lisamine võtmerfraaside genereerimisse تولید محدودیت لینگیستیک در تولید کلید عبارت Kielellisten rajoitusten sisällyttäminen avainlauseiden luomiseen Intégrer les contraintes linguistiques dans la génération de phrases clés Srianta Teanga a Ionchorprú i nGiniúint Eochairfhrása KCharselect unicode block name מכיל מחסומות לינגליות לייצור מילים מפתחיים कीफ्रेज़ जनरेशन में भाषाई बाधाओं को शामिल करना Uključujući Lingističke ograničenje u Generaciju ključne fraze Nyelvi korlátozások beépítése a kulcskifejezések generálásába Լեզվային սահմանափակումներ ներառելը ստեղծագործական արտահայտության մեջ Incorporating Linguistic Constraints into Keyphrase Generation Incorporare vincoli linguistici nella generazione di parole chiave キーフレーズ生成に言語的制約を組み込む politenessoffpolite"), and when there is a change ("assertivepoliteness კლავიფრაზის შექმნა ლინგურისტიკური შედგა Лингистикалық шектеулерді кілтсөзді құру 언어 제약을 키워드 생성에 포함시키다 Linguistinių apribojimų įtraukimas į pagrindinės frazės kūrimą Вклучување на јазични ограничувања во генерацијата на клучни фрази കീവോര്ഡ്രേസ് ജനിപ്പിലേക്ക് ലിങ്ഗിസ്റ്റിക് കോണ്ട്രെന്റുകള് ചേര്ക്കുന്നു Холбоо хэлбэрийн хязгаарлалтыг товч хэлбэрээр бий болгох Memasukkan Kebatasan Bahasa ke Jenerasi Frasa Kekunci Incorporating Linguistic Constraints into Keyphrase Generation Opnemen van taalkundige beperkingen in het genereren van sleutelwoorden Inkorporering av linguistiske begrensningar i oppretting av nøkkelfrasar Włączanie ograniczeń językowych do generowania fraz kluczowych Incorporando restrições linguísticas na geração de frases-chave Incorporarea constrângerilor lingvistice în generarea frazelor cheie Включение лингвистических ограничений в генерацию ключевых фраз ලින්ග්විස්ටික් සීමාවල් යතුරු ප්රශ්නයක් නිර්මාණය කරනවා Vključevanje jezikovnih omejitev v ustvarjanje ključnih fraz Isticmaalidda luqada Duke përfshirë kufizimet gjuhësore në gjenerimin e frazëve kyçe Uključujući Lingističke ograničenje u Generaciju ključne fraze Att införliva språkliga begränsningar i nyckelfrasgenerering Kuingiza Mashitaka ya Kilinguistic katika Generation of Keyphrase விசைசொற்றொடர் உருவாக்கத்திற்கு இணைப்பு மாற்றுதல்களை சேர்க்கிறது Diller Kiçi Senediňe Ewez Et Keyphrase Generation میں Linguistic Constraints Name Liên kết các điều nhỏ 约束并于要短语生成中
Abstract
Keyphrases, that concisely describe the high-level topics discussed in a document, are very useful for a wide range of natural language processing tasks. Though existing keyphrase generation methods have achieved remarkable performance on this task, they generate many overlapping phrases (including sub-phrases or super-phrases) of keyphrases. In this paper, we propose the parallel Seq2Seq network with the coverage attention to alleviate the overlapping phrase problem. Specifically, we integrate the linguistic constraints of keyphrase into the basic Seq2Seq network on the source side, and employ the multi-task learning framework on the target side. In addition, in order to prevent from generating overlapping phrases of keyphrases with correct syntax, we introduce the coverage vector to keep track of the attention history and to decide whether the parts of source text have been covered by existing generated keyphrases. Experimental results show that our method can outperform the state-of-the-art CopyRNN on scientific datasets, and is also more effective in news domain.Abstract
Sleutelfrase, wat saamstig beskryf die hoë vlak onderwerpe wat in 'n dokument gespreek is, is baie nuttig vir 'n wyde reek van natuurlike taal verwerking opdragte. Alhoewel bestaande sleutelfrase generasie metodes betekende prestasie op hierdie taak bereik het, genereer hulle baie oorvloediende frase (insluitend subfrase of superfrase) van sleutelfrase. In hierdie papier, voorstel ons die parallele Seq2Seq-netwerk met die dekkening aandag om die oorvloediging van frase probleem te verminder. Spesifieke, ons integreer die lingwisiese beheinings van sleutelfrase in die basiese Seq2Seq netwerk op die bron kant en gebruik die multi-taak leer raamwerk op die doel kant. In addition, in order to prevent from generating overlapping phrases of keyphrases with correct syntax, we introduce the coverage vector to keep track of the attention history and to decide whether the parts of source text have been covered by existing generated keyphrases. Eksperimentale resultate wys dat ons metode kan die state-of-the-art CopyRNN op wetenskaplike datastelle uitvoer, en is ook meer effektief in nuusdomein.Abstract
በሰነድ ላይ የተነጋገረውን ከፍተኛ ደረጃዎች ላይ የሚለውን የቁልፍ ቃላት ለባሕላዊ ቋንቋ ማቀናቀል ስራዎችን ለመስጠት እጅግ ይጠቅማል፡፡ ምንም እንኳን በሥርዓት ላይ የፊደል ቃላት መዝገብ ማድረግ አግኝቷል ቢሆንም፣ የፊደል ቃላት (በትዊታዊ ቃላት ወይም ትልቅ ቃላት) ብዙዎችን ክፍሎች ማድረግ ያደርጋሉ። በዚህ ፕሮግራም፣ የSeq2Seq መረብ በማስተካከል የቃላትን መክፈት ለማሻሻል እናስባለን፡፡ በተለይም፣ የቋንቋው ግንኙነት የክፍሎችን ግንኙነት ወደ ቋንቋው በኩል ወደ ምዕራብ ዳርቻ እናስገባለን፡፡ በተጨማሪም፣ የክሊፕቦርዱን ቃላት በመክፈት ሲንካስብ ለመግለጽ እናስጠጋለን፡፡ ፈተና ውጤቶች የኢንተርኔት አካባቢ አካባቢ አካባቢ አዳራሲ አካባቢ እና በዜና አካባቢ ውስጥ የተሻለ ነው፡፡Abstract
تعتبر العبارات الرئيسية ، التي تصف بإيجاز الموضوعات عالية المستوى التي تمت مناقشتها في مستند ، مفيدة جدًا لمجموعة واسعة من مهام معالجة اللغة الطبيعية. على الرغم من أن أساليب إنشاء عبارة المفاتيح الحالية قد حققت أداءً رائعًا في هذه المهمة ، إلا أنها تولد العديد من العبارات المتداخلة (بما في ذلك العبارات الفرعية أو العبارات الفائقة) من العبارات الرئيسية. في هذا البحث ، نقترح شبكة Seq2Seq الموازية مع الاهتمام بالتغطية للتخفيف من مشكلة تداخل العبارة. على وجه التحديد ، نقوم بدمج القيود اللغوية للعبارة الرئيسية في شبكة Seq2Seq الأساسية على جانب المصدر ، واستخدام إطار عمل التعلم متعدد المهام على الجانب المستهدف. بالإضافة إلى ذلك ، من أجل منع إنشاء عبارات متداخلة من العبارات الرئيسية مع بناء الجملة الصحيح ، نقدم متجه التغطية لتتبع سجل الانتباه ولتحديد ما إذا كانت أجزاء النص المصدر قد تمت تغطيتها من خلال العبارات الرئيسية التي تم إنشاؤها حاليًا. تظهر النتائج التجريبية أن طريقتنا يمكن أن تتفوق على أحدث نسخة من CopyRNN في مجموعات البيانات العلمية ، كما أنها أكثر فاعلية في مجال الأخبار.Abstract
Dökümündə mübahisə edilən yüksək səviyyə məsələlərini təsdiqləyən anahtar sözləri, təbiətli dil işləməsi işlərinin çoxlu səviyyəsi üçün çox faydalanırlar. Halbuki bu işdə mövcuddur anahtar sözlərin nəzəriyyəti metodları müəyyən bir performansı başa düşmüşdür, onlar anahtar sözlərinin çoxluğunu (sub-phrases və super-phrases də dahil olmaqla) tərpənməyən cümlələrini yaradırlar. Bu kağızda, paralel Seq2Seq ağını gizlətmək üçün çəkilmə məlumatını azaltmaq üçün təklif edirik. Özellikle, biz anahtar sözlərinin dil müəyyənlərini mənbə tərəfində Seq2Seq ağcına birləşdiririk və məqsəd tərəfində çox-iş öyrənmə framework ünü istifadə edirik. Əvvəlcə, anahtar sözlərini düzgün syntaksiylə təkrarlanmamaq üçün gözləmə tarihini izləmək və mənbə mətnlərin parçalarının mevcut edilmiş anahtar sözləri ilə örtülmüş olmasını təsdiqləyirik. Müvəffəqiyyət sonuçları elmi verilən qurbanlarda həmçin in metodumuzun həmçinin həmçinin həmçinin həmçinin həmçinin xəbər domeinlərində daha etkilidir.Abstract
Ключовите фрази, които кратко описват темите на високо ниво, обсъждани в документ, са много полезни за широк спектър от задачи по обработка на естествения език. Въпреки че съществуващите методи за генериране на ключови фрази са постигнали забележително изпълнение на тази задача, те генерират много припокриващи се фрази (включително подфрази или супер фрази) на ключови фрази. В настоящата статия предлагаме паралелна мрежа с внимание на покритието за облекчаване на проблема с припокриващите се фрази. По-конкретно, ние интегрираме езиковите ограничения на ключовите фрази в основната мрежа от страната на източника и използваме рамката за обучение с множество задачи от целевата страна. Освен това, за да се предотврати генерирането на припокриващи се фрази от ключови фрази с правилен синтаксис, въвеждаме вектора на покритие, за да следим историята на вниманието и да решим дали частите от изходния текст са обхванати от съществуващи генерирани ключови фрази. Експерименталните резултати показват, че нашият метод може да надмине най-съвременните копия на научните набори от данни и също така е по-ефективен в областта на новините.Abstract
একটি নথিতে আলোচনা করা উচ্চপর্যায়ের বিষয়গুলোকে কীবোর্ডের ব্যাখ্যা করা হয়েছে, প্রাকৃতিক ভাষা প্রক্রিয়ার কাজের জন্য ব্যাপারে যদিও বিদ্যমান কীব্রের প্রজন্মের পদ্ধতি এই কাজে চমৎকার প্রকাশিত হয়েছে, তবুও তারা কীবোর্ডের অনেক বাক্য তৈরি করেছে (যার মধ্যে সাব-বাক্যার অথবা সু এই কাগজটিতে আমরা প্রস্তাব করছি সেক২সেক নেটওয়ার্কের প্যারালেল নেটওয়ার্ক, যেখানে কাভারেজের মনোযোগ প্রদান করা হয়েছে য বিশেষ করে, আমরা কীবাক্ষরের ভাষার নিয়ম সেক২Seq নেটওয়ার্কে একত্রিত করি এবং লক্ষ্যপ্রান্তে বহু কাজের শিক্ষা ফ্রেম্যাক্টর কাজ করি। এছাড়াও, সঠিক সিন্যাক্স দ্বারা কীবিক্ষেত্রের বাক্য উল্লেখ করতে বাধা দেয়ার জন্য আমরা কাভারেজ ভেক্টর পরিচয় দেখাচ্ছি যাতে এই ইতিহাসের দৃষ্টিভঙ্গি রাখা এবং স Experimental results show that our method can outperform the state-of-the-art CopyRNN on scientific datasets, and is also more effective in news domain.Abstract
གཙོ་ཚིག་འདིས་ཡིག་ཚང་ནང་དུ་གཏན་ཁེལ་བའི་གནད་དོན་རིམ་མཐོ་རིམ་མང་ཙམ་སྦྲེལ་བ་ཡིན་པ་ལས་སྤྱོད་ཆེན་ཡོད་པ། ད་ལྟ་བུའི་གནད་དོན་གཙོ་ཚིག་བཟོ་བར་ལམ་ལུགས་འདི་ལ་ལས་འཕགས་རིས་བྱུང་མྱོང་ཡོད་ནའང་དེ་ཚོ་སྒྲུབ་གཏོང་གི་ཚིག་རྐང་མང་པོ་ཞིག་གསར་ འོག་གི་ཤོག་བྱང་འདིའི་ནང་དུ་ང་ཚོས་རང་ཉིད་སྒྲིག་གི་Seq2Seq དྲ་རྒྱའི་ནང་དུ་ཆ་མཐོང ང་ཚོས་ཁྱད་པར་དབང་ཡུལ་གྱི་སྐད་ཡིག་ཆ་ལུགས་ཀྱི་རྩིས་གཞི་སྒྲིག་གི་Seq2Seq network་ཐོག་མའི་ཕྱོགས་ཐོག་ཏུ་སྒྲིག་ཡོད་པ་དང་དམིགས་ཡུལ་ཕྱོགས་ In addition, in order to prevent from generating overlapping phrases of keyphrases with correct syntax, we introduce the coverage vector to keep track of the attention history and to decide whether the parts of source text have been covered by existing generated keyphrases. Experimental Results show that our method can outperform the state-of-the-art CopyRNN on scientific data sets and is also more effective in news domain.Abstract
Ključne fraze, koje potpuno opisuju teme visokog nivoa raspravljene u dokumentu, veoma su korisne za širok niz prirodnih zadataka za obradu jezika. Iako postojeće metode generacije ključnih fraza postigle su izvanredne funkcije na ovom zadatku, oni stvaraju mnoge preoklapajuće fraze (uključujući podfraze ili super fraze) ključnih fraza. U ovom papiru predlažemo paralelnu mrežu Seq2Seq sa pažnjom pokrivanja da ublažimo problem preklapanja fraza. Posebno, integriramo jezičke ograničenje ključne fraze u osnovnu mrežu Seq2Seq na izvornoj strani, i zapošljavamo multi task učenje okvir na ciljnoj strani. Osim toga, kako bismo spriječili da proizvedemo preklapanje rečenica ključnih fraza s pravim sintaksom, predstavljamo vektor pokrivanja kako bi pratili povijest pažnje i odlučili da li su dijelovi teksta izvora pokriveni postojećim proizvedenim ključnim frazama. Eksperimentalni rezultati pokazuju da naš metod može izvršiti državu umjetnosti CopyRNN na naučnim podacima, a također je učinkovitiji u novinskom domenu.Abstract
Les frases clau, que descriuen concretament els temes d'alt nivell discutits en un document, són molt útils per a una gran gamma de tasques naturals de processament de llenguatges. Tot i que els mètodes de generació de frases clau existents han aconseguit un desempeny notable en aquesta tasca, generen moltes frases sovrapposes (incloent-se sub-frases o super-frases) de frases clau. En aquest paper, proposem la xarxa Seq2Seq paralèl·lela amb l'atenció de cobertura per aliviar el problema de frases sovrapposades. Concretament, integram les restriccions lingüístices de la frase clau a la xarxa bàsica Seq2Seq al costat de la font, i utilitzem el marc d'aprenentatge multitasca al costat de l'objectiu. A més, per evitar que generin frases de clau sovint amb síntaxi correcta, introduïm el vector de cobertura per seguir la història de l'atenció i decidir si les parts del text fonts han estat cobertas per frases clau generades existents. Els resultats experimentals mostren que el nostre mètode pot superar el CopyRNN més avançat en conjunts de dades científices, i també és més efectiu en el domini de notícies.Abstract
Klíčové fráze, které stručně popisují témata na vysoké úrovni diskutovaná v dokumentu, jsou velmi užitečné pro širokou škálu úkolů zpracování přirozeného jazyka. Přestože existující metody generování klíčových frází dosáhly pozoruhodného výkonu v tomto úkolu, generují mnoho překrývajících se frází (včetně podfrází nebo superfrází) klíčových frází. V tomto článku navrhujeme paralelní síť Seq2Seq s pozorností pokrytí pro zmírnění překrývajícího se frázového problému. Konkrétně integrujeme jazyková omezení klíčové fráze do základní sítě Seq2Seq na zdrojové straně a na cílové straně využíváme multi-tasking učební framework. Kromě toho, abychom zabránili generování překrývajících se frází klíčových frází se správnou syntaxi, zavádíme vektor pokrytí, abychom sledovali historii pozornosti a rozhodli, zda byly části zdrojového textu pokryty existujícími generovanými klíčovými frází. Experimentální výsledky ukazují, že naše metoda může překonat nejmodernější CopyRNN na vědeckých datových sadách a je také efektivnější v oblasti zpravodajství.Abstract
Nøglesætninger, der kortfattet beskriver de emner på højt niveau, der diskuteres i et dokument, er meget nyttige til en lang række naturlige sprogbehandlingsopgaver. Selvom eksisterende nøglesætningsgenereringsmetoder har opnået bemærkelsesværdig ydeevne på denne opgave, genererer de mange overlappende sætninger (herunder undersætninger eller supersætninger) af nøglesætninger. I denne artikel foreslår vi det parallelle Seq2Seq netværk med dækningsopmærksomhed for at afhjælpe det overlappende sætningsproblem. Specielt integrerer vi de sproglige begrænsninger af keyphrase i det grundlæggende Seq2Seq netværk på kildesiden, og anvender multi-task learning framework på målsiden. For at undgå at generere overlappende sætninger af nøglesætninger med korrekt syntaks introducerer vi desuden dækningsvektoren for at holde styr på opmærksomhedshistorikken og for at beslutte, om delene af kildeteksten er blevet dækket af eksisterende genererede nøglesætninger. Eksperimentelle resultater viser, at vores metode kan overgå det avancerede CopyRNN på videnskabelige datasæt, og er også mere effektiv på nyhedsområdet.Abstract
Keyphrasen, die die in einem Dokument diskutierten übergeordneten Themen prägnant beschreiben, sind sehr nützlich für eine Vielzahl natürlicher Sprachverarbeitungsaufgaben. Obwohl vorhandene Methoden zur Generierung von Keyphrasen bemerkenswerte Leistung bei dieser Aufgabe erreicht haben, generieren sie viele überlappende Phrasen (einschließlich Unterphrasen oder Superphrasen) von Keyphrasen. In diesem Papier schlagen wir das parallele Seq2Seq Netzwerk vor, mit der Abdeckung Aufmerksamkeit, um das überlappende Phrasenproblem zu lindern. Konkret integrieren wir die sprachlichen Einschränkungen der Keyphrase auf der Quellseite in das grundlegende Seq2Seq-Netzwerk und setzen das Multi-Task-Lernframework auf der Zielseite ein. Um das Generieren überlappender Phrasen von Keyphrasen mit korrekter Syntax zu verhindern, führen wir den Coverage-Vektor ein, um den Aufmerksamkeitsverlauf zu verfolgen und zu entscheiden, ob die Teile des Quelltextes von bereits generierten Keyphrasen abgedeckt wurden. Experimentelle Ergebnisse zeigen, dass unsere Methode den aktuellen CopyRNN auf wissenschaftlichen Datensätzen übertreffen kann und auch im Nachrichtenbereich effektiver ist.Abstract
Οι φράσεις-κλειδιά, που περιγράφουν συνοπτικά τα θέματα υψηλού επιπέδου που συζητούνται σε ένα έγγραφο, είναι πολύ χρήσιμες για ένα ευρύ φάσμα εργασιών επεξεργασίας φυσικής γλώσσας. Αν και οι υπάρχουσες μέθοδοι δημιουργίας φράσεων κλειδιού έχουν επιτύχει αξιοσημείωτη απόδοση σε αυτό το έργο, παράγουν πολλές επικαλυπτόμενες φράσεις (συμπεριλαμβανομένων των υποφράσεων ή των υπερφράσεων) φράσεων κλειδιού. Στην παρούσα εργασία, προτείνουμε το παράλληλο δίκτυο με την προσοχή κάλυψης για την ανακούφιση του προβλήματος επικαλυπτόμενων φράσεων. Συγκεκριμένα, ενσωματώνουμε τους γλωσσικούς περιορισμούς της φράσης κλειδί στο βασικό δίκτυο από την πλευρά της πηγής και χρησιμοποιούμε το πλαίσιο εκμάθησης πολλαπλών εργασιών στην πλευρά του στόχου. Επιπλέον, προκειμένου να αποφευχθεί η δημιουργία επικαλυπτόμενων φράσεων από φράσεις κλειδιά με σωστή σύνταξη, εισάγουμε το διάνυσμα κάλυψης για να παρακολουθείτε το ιστορικό προσοχής και να αποφασίσετε αν τα τμήματα του αρχικού κειμένου έχουν καλυφθεί από υπάρχουσες φράσεις κλειδιά. Τα πειραματικά αποτελέσματα δείχνουν ότι η μέθοδος μας μπορεί να ξεπεράσει την υπερσύγχρονη σε επιστημονικά σύνολα δεδομένων, και είναι επίσης πιο αποτελεσματική στον τομέα των ειδήσεων.Abstract
Las frases clave, que describen de manera concisa los temas de alto nivel discutidos en un documento, son muy útiles para una amplia gama de tareas de procesamiento del lenguaje natural. Aunque los métodos de generación de frases clave existentes han logrado un rendimiento notable en esta tarea, generan muchas frases superpuestas (incluidas subfrases o superfrases) de frases clave. En este artículo, proponemos la red Seq2Seq paralela con la atención de cobertura para aliviar el problema de la superposición de frases. Específicamente, integramos las restricciones lingüísticas de la frase clave en la red básica Seq2Seq en el lado de la fuente, y empleamos el marco de aprendizaje multitarea en el lado del objetivo. Además, para evitar que se generen frases superpuestas de frases clave con una sintaxis correcta, introducimos el vector de cobertura para realizar un seguimiento del historial de atención y decidir si las partes del texto fuente han sido cubiertas por frases clave generadas existentes. Los resultados experimentales muestran que nuestro método puede superar al copyRNN de última generación en conjuntos de datos científicos, y también es más eficaz en el dominio de las noticias.Abstract
Märksõnad, mis kirjeldavad lühidalt dokumendis arutatud kõrgetasemelisi teemasid, on väga kasulikud paljude looduskeele töötlemise ülesannete jaoks. Kuigi olemasolevad võtmerfraaside genereerimise meetodid on selles ülesandes saavutanud märkimisväärse tulemuse, tekitavad nad mitmeid kattuvaid fraase (sealhulgas alamfraase või superfraase) võtmerfraase. Käesolevas dokumendis pakume välja paralleelne Seq2Seq võrgustik kattuvate fraaside probleemi leevendamiseks. Täpsemalt integreerime võtmefraasi keelelised piirangud algvõrgustikku Seq2Seq ja kasutame sihtküljel mitme ülesandega õppe raamistikku. Lisaks sellele, et vältida korrektse süntaksiga klahvfraaside kattuvate fraaside tekkimist, tutvustame katvusvektorit, et jälgida tähelepanu ajalugu ja otsustada, kas lähteteksti osad on kaetud olemasolevate genereeritud klahvfraasidega. Eksperimentaalsed tulemused näitavad, et meie meetod võib ületada tipptasemel CopyRNNi teaduslikes andmekogumites ja on tõhusam ka uudiste valdkonnas.Abstract
جملههای کلید، که دقیقاً موضوعهای سطح بالا که در یک سند بحث شده را توصیف میکنند، برای مجموعهای از کارهای پرداخت زبان طبیعی بسیار مفید هستند. اگرچه روش تولید کلید عبارت موجود در این کار عملکرد فوق العاده به دست آوردهاند، آنها جملههای کلید (شامل جملههای زیر عبارت یا فوقفرض) را تولید میکنند. در این کاغذ، ما شبکه مرتبل Seq2Seq را با توجه محافظت پیشنهاد می کنیم تا مشکل عبارت را کم کند. به طور خاص، ما محدودیت زبانشناسی کلید را در شبکه بنیادی Seq2Seq در کنار منبع تفریح میکنیم و چهارچهارچهارچهارچهارچهارچهارچهارچهارچهارچهارچهارچهارچهارچهارچهارچهارچ علاوه بر این، برای جلوگیری از تولید کردن جملههای کلید با ویکتوری درست، ویکتور پوشش را معرفی میکنیم تا تاریخ توجه را نگه داریم و تصمیم بگیریم آیا بخشهای متن منبع توسط جملههای کلید تولید شدهاند پوشش داده شده است. نتیجههای تجربهی ما نشان میدهند که روش ما میتواند کپیرنی هنری را در مجموعههای دادههای علمی انجام دهد، و همچنین در مجموعههای خبریها موثر تر است.Abstract
Avainsanat, jotka kuvaavat lyhyesti asiakirjassa käsiteltyjä korkean tason aiheita, ovat erittäin hyödyllisiä monenlaisissa luonnollisen kielen käsittelytehtävissä. Vaikka nykyiset avainlauseiden luonti menetelmät ovat saavuttaneet huomattavan suorituskyvyn tässä tehtävässä, ne tuottavat monia päällekkäisiä lauseita (mukaan lukien alalauseita tai superlauseita) avainlauseista. Tässä artikkelissa ehdotamme rinnakkaista Seq2Seq-verkkoa peittoalueella päällekkäisen lauseongelman lievittämiseksi. Erityisesti integroimme avainlauseen kielelliset rajoitukset lähdepuolen Seq2Seq-perusverkkoon ja käytämme kohdepuolen monitehtäväoppimista. Jotta vältettäisiin päällekkäisten avainlauseiden syntyminen oikealla syntaksilla, otamme käyttöön peittovektorin seuraamaan huomiohistoriaa ja päättämään, onko lähdetekstin osat katettu olemassa olevilla avainlauseilla. Kokeelliset tulokset osoittavat, että menetelmämme pystyy suoriutumaan tieteellisessä aineistossa paremmin kuin CopyRNN, ja se on tehokkaampi myös uutisalalla.Abstract
Les phrases clés, qui décrivent de manière concise les sujets de haut niveau abordés dans un document, sont très utiles pour un large éventail de tâches de traitement du langage naturel. Bien que les méthodes existantes de génération de phrases clés aient atteint des performances remarquables dans cette tâche, elles génèrent de nombreuses phrases qui se chevauchent (y compris des sous-phrases ou des super-phrases) de phrases clés. Dans cet article, nous proposons le réseau parallèle Seq2Seq avec l'attention de couverture pour atténuer le problème de chevauchement de phrases. Plus précisément, nous intégrons les contraintes linguistiques des phrases clés dans le réseau Seq2Seq de base côté source, et utilisons le framework d'apprentissage multitâche côté cible. De plus, afin d'éviter de générer des phrases clés superposées avec une syntaxe correcte, nous introduisons le vecteur de couverture pour garder une trace de l'historique de l'attention et pour décider si les parties du texte source ont été couvertes par des phrases clés générées existantes. Les résultats expérimentaux montrent que notre méthode peut surpasser le CopyRNN de pointe sur les ensembles de données scientifiques, et qu'elle est également plus efficace dans le domaine de l'actualité.Abstract
Tá eochairfhrásaí, a chuireann síos go beacht ar na topaicí ardleibhéil a phléitear i ndoiciméad, an-úsáideach le haghaidh raon leathan de thascanna próiseála teanga nádúrtha. Cé go bhfuil feidhmíocht iontach bainte amach ag modhanna ginte eochairfhrása sa tasc seo, gineann siad go leor frásaí forluiteacha (lena n-áirítear fo-fhrásaí nó sárfhrásaí) eochairfhrásaí. Sa pháipéar seo, molaimid an líonra comhthreomhar Seq2Seq leis an aird clúdach chun an fhadhb frása forluiteacha a mhaolú. Go sonrach, comhtháthaimid srianta teanga an eochairfhrása isteach sa bhunghréasán Seq2Seq ar thaobh na foinse, agus bainimid úsáid as an gcreat foghlama il-tasc ar an taobh sprice. Ina theannta sin, chun cosc a chur le frásaí forluiteacha eochairfhrásaí le comhréir cheart a ghiniúint, tugaimid isteach an veicteoir clúdaigh chun cuntas a choinneáil ar an stair aird agus chun a chinneadh an bhfuil na codanna den téacs foinse clúdaithe ag eochairfhrásaí ginte atá ann cheana féin. Léiríonn torthaí turgnamhacha gur féidir lenár modh feidhmiú níos fearr ná an CopyRNN úrscothach ar thacair sonraí eolaíocha, agus go bhfuil sé níos éifeachtaí i réimse na nuachta freisin.Abstract
@ action: button Though existing keyphrase generation methods have achieved remarkable performance on this task, they generate many overlapping phrases (including sub-phrases or super-phrases) of keyphrases. Ga wannan takardan, Munã goyyade shirin Seq2Seq ta daidaita da muhalli wa dabooli dõmin ya sauƙaƙara matabbar da ya faɗaɗa. Yana ƙayyade, za'a haɗa tsarin maɓalli na lugha cikin zane-zane zuwa zuwa na'uran Sq2Seq a kan asalin na'ura, kuma munã aiki firam masu sanar da mulki-aikin da ke kan hagan goan. Kuma da wancan, don ya hana ya ƙẽtare wa ka ƙãga halittar maganar kayan rufe magana da shiryarwa, za mu ƙãga hanyar rufe kwamfyuta dõmin ka tsare jerin kwanan aikin muhalli kuma Mu hukunta, ko an rufe rabon matsayin source da maɓallin maɓallin da aka ƙãga halittar. Matarin jarrabai ke nuna cewa metodenmu yana iya samar da halin-the-art CopyRNN kan masu sakar da aka sani, kuma yana da mafiya amfani cikin sauran da za'a sani.Abstract
מבטים מפתחים, שמתארים בקצר את הנושאים ברמה גבוהה ששוחחים במסמך, הם מאוד שימושיים לטווח רחב של משימות עיבוד שפה טבעיות. למרות שיטות יוצרת משפטים מפתחות קיימות השיגו ביצועים מדהימים על המשימה הזאת, הם יוצרים משפטים רבים מתקפלים (כולל משפטים מתחתונים או משפטים סופרים) של משפטים מפתחים. בעיתון הזה, אנו מציעים את רשת Seq2Seq מקבילה עם תשומת לב הכיסוי כדי להקל על בעיית המשפטים המתכפלים. במיוחד, אנחנו משתלבים את ההגבלות הלשוניות של ביטוי המפתח לרשת הסק2סק הבסיסית בצד המקור, ולהשתמש במסגרת הלימוד של משימות רבות בצד המטרה. בנוסף, כדי למנוע מליצור משפטים מתקפלים של משפטים מפתחים עם סינטקס נכון, אנו מכירים את ווקטור הכיסוי כדי לשמור על ההיסטוריה של תשומת לב ולהחליט אם החלקים של טקסט מקור היו מכוסים על ידי משפטים מפתחים מיוצרים קיימים. תוצאות ניסיוניות מראות ששיטתנו יכולה להעביר את עותק RNN המיוחד ביותר על קבוצות נתונים מדעיים, והיא גם יותר יעילה בתחום החדשות.Abstract
Keyphrases, जो संक्षिप्त रूप से एक दस्तावेज़ में चर्चा किए गए उच्च-स्तरीय विषयों का वर्णन करते हैं, प्राकृतिक भाषा प्रसंस्करण कार्यों की एक विस्तृत श्रृंखला के लिए बहुत उपयोगी हैं। यद्यपि मौजूदा कीफ्रेज़ जनरेशन विधियों ने इस कार्य पर उल्लेखनीय प्रदर्शन प्राप्त किया है, वे कीफ्रेज़ के कई अतिव्यापी वाक्यांशों (उप-वाक्यांशों या सुपर-वाक्यांशों सहित) उत्पन्न करते हैं। इस पेपर में, हम ओवरलैपिंग वाक्यांश समस्या को कम करने के लिए कवरेज ध्यान के साथ समानांतर Seq2Seq नेटवर्क का प्रस्ताव करते हैं। विशेष रूप से, हम स्रोत पक्ष पर मूल Seq2Seq नेटवर्क में keyphrase की भाषाई बाधाओं को एकीकृत करते हैं, और लक्ष्य पक्ष पर बहु-कार्य सीखने के ढांचे को नियोजित करते हैं। इसके अलावा, सही वाक्यविन्यास के साथ keyphrases के अतिव्यापी वाक्यांशों को उत्पन्न करने से रोकने के लिए, हम ध्यान इतिहास का ट्रैक रखने के लिए कवरेज वेक्टर पेश करते हैं और यह तय करने के लिए कि स्रोत पाठ के कुछ हिस्सों को मौजूदा उत्पन्न keyphrases द्वारा कवर किया गया है या नहीं। प्रयोगात्मक परिणामों से पता चलता है कि हमारी विधि वैज्ञानिक डेटासेट पर अत्याधुनिक CopyRNN को पछाड़ सकती है, और समाचार डोमेन में भी अधिक प्रभावी है।Abstract
Ključne rečenice, koje potpuno opisuju teme visoke razine raspravljene u dokumentu, veoma su korisne za širok raspon zadataka prirodnog obrade jezika. Iako postojeće metode generacije ključnih fraza postigle su izvanredne učinke na ovom zadatku, stvaraju mnoge preklapačne fraze (uključujući podfraze ili super fraze) ključnih fraza. U ovom papiru predlažemo paralelnu mrežu Seq2Seq sa pažnjom na pokrivanje da ublažimo problem preklapanja fraza. Posebno, integriramo jezičke ograničenje ključne fraze u osnovnu mrežu Seq2Seq na izvornoj strani i upotrebimo okvir učenja multizadataka na ciljnoj strani. Osim toga, kako bismo spriječili da proizvedemo preklapanje rečenica ključnih fraza s pravom sintaksom, predstavljamo vektor pokrivanja kako bi pratili povijest pažnje i odlučili da li su dijelovi teksta izvora pokrili postojećim proizvedenim ključnim frazama. Eksperimentalni rezultati pokazuju da naš metod može izvršiti državu umjetnosti CopyRNN na naučnim podacima, a također je učinkovitiji u vijestima domenu.Abstract
A dokumentumban tárgyalt magas szintű témákat tömören leíró kulcskifejezések nagyon hasznosak a természetes nyelvfeldolgozási feladatok széles skálájához. Bár a meglévő kulcskifejezések generálási módszerei figyelemreméltó teljesítményt értek el ebben a feladatban, számos egymást átfedő kifejezést (beleértve az alkifejezéseket vagy szuperkifejezéseket) generálnak kulcskifejezésekből. Ebben a tanulmányban a párhuzamos Seq2Seq hálózatot javasoljuk lefedettségi figyelemmel az átfedő mondatok problémájának enyhítésére. Konkrétan integráljuk a kulcskifejezés nyelvi korlátait az alap Seq2Seq hálózatba a forrás oldalon, és alkalmazzuk a többfeladatos tanulási keretet a céloldalon. Ezenkívül annak érdekében, hogy megakadályozzuk, hogy a kulcskifejezések helyes szintaxissal átfedő kifejezéseket generáljanak, bevezetjük a lefedettségi vektort, hogy nyomon kövessük a figyelem előzményeit és eldöntsük, hogy a forrásszöveg részeit lefedték-e a meglévő generált kulcskifejezések. Kísérleti eredmények azt mutatják, hogy módszerünk a tudományos adatok legkorszerűbb CopyRNN teljesítményét felülmúlja, és hatékonyabb a hírek területén is.Abstract
Հիմնական արտահայտությունները, որոնք կոնկրետ նկարագրում են փաստաթղթի մեջ քննարկված բարձր մակարդակի թեմաները, շատ օգտակար են բնական լեզվի վերամշակման բազմաթիվ խնդիրների համար: Չնայած, որ գոյություն ունի հիմնական արտահայտություններ ստեղծելու մեթոդներ, որոնք հասել են այս խնդիրը, դրանք ստեղծում են բազմաթիվ կապված արտահայտություններ (ներառյալ ենթաարտահայտություններ կամ գերարտահայտություններ): Այս թղթի մեջ մենք առաջարկում ենք SeQ2SeQ-ի զուգահեռ ցանցը, որտեղ ներգրավված է ուշադրությունը, որպեսզի նվազեցնենք կապված արտահայտությունների խնդիրը: Հատկապես, մենք ինտեգրում ենք գլխավոր արտահայտության լեզվաբանական սահմանափակումները աղբյուրի կողմում SeQ2SeQ հիմնական ցանցի մեջ և օգտագործում ենք բազմախնդիր ուսուցման շրջանակը նպատակային կողմում: Ավելին, որպեսզի խոչընդոտենք ճիշտ սինտաքսի միջոցով կողմնակի արտահայտություններ ստեղծելու, մենք ներկայացնում ենք ծածկության վեկտորը ուշադրության պատմության հետևելու համար և որոշենք, արդյոք աղբյուր տեքստի մասերը ծածկված են գոյություն ունեցող ստեղծված Փորձարկվող արդյունքները ցույց են տալիս, որ մեր մեթոդը կարող է գերազանցել գիտական տվյալների համակարգերի վերջին համակարգերը, ինչպես նաև ավելի արդյունավետ է նորությունների ոլորտում:Abstract
Frasa kunci, yang secara singkat menjelaskan topik tingkat tinggi yang didiskusikan dalam dokumen, sangat berguna untuk jangkauan lebar dari tugas proses bahasa alam. Meskipun metode generasi frasa kunci yang ada telah mencapai prestasi yang luar biasa pada tugas ini, mereka menghasilkan banyak frasa saling bertindak (termasuk sub-frasa atau super-frasa) dari frasa kunci. Dalam kertas ini, kami mengusulkan jaringan Seq2Seq paralel dengan perhatian meliputi untuk mengurangi masalah frasa yang saling bertindak. Secara spesifik, kita mengintegrasikan batasan bahasa dari frasa kunci ke jaringan dasar Seq2Seq di sisi sumber, dan menggunakan rangka belajar multi-tugas di sisi sasaran. Selain itu, untuk mencegah dari menghasilkan frasa-frasa kunci yang saling bertindak dengan sintaks yang benar, kami memperkenalkan vektor penyamaran untuk menjaga jejak sejarah perhatian dan untuk memutuskan apakah bagian dari teks sumber telah ditutup oleh frasa kunci yang telah dihasilkan. Experimental results show that our method can outperform the state-of-the-art CopyRNN on scientific datasets, and is also more effective in news domain.Abstract
Le frasi chiave, che descrivono in modo conciso gli argomenti di alto livello discussi in un documento, sono molto utili per una vasta gamma di attività di elaborazione del linguaggio naturale. Sebbene i metodi di generazione delle keyphrase esistenti abbiano raggiunto prestazioni notevoli in questo compito, generano molte frasi sovrapposte (incluse sotto-frasi o super-frasi) delle keyphrase. In questo articolo, proponiamo la rete parallela Seq2Seq con l'attenzione di copertura per alleviare il problema delle frasi sovrapposte. Nello specifico, integriamo i vincoli linguistici della keyphrase nella rete di base Seq2Seq dal lato sorgente e impieghiamo il framework di apprendimento multi-task dal lato target. Inoltre, al fine di evitare di generare frasi sovrapposte di keyfras con sintassi corretta, introduciamo il vettore di copertura per tenere traccia della cronologia dell'attenzione e per decidere se le parti del testo sorgente sono state coperte da keyfras generate esistenti. I risultati sperimentali mostrano che il nostro metodo può superare lo stato dell'arte CopyRNN su set di dati scientifici, ed è anche più efficace nel campo delle notizie.Abstract
文書で説明されているハイレベルなトピックを簡潔に説明するキーフレーズは、幅広い自然言語処理タスクに非常に役立ちます。 既存のキーフレーズ生成方法は、このタスクで卓越したパフォーマンスを達成したが、それらはキーフレーズの多くの重複するフレーズ(サブフレーズまたはスーパーフレーズを含む)を生成する。 本稿では、重複するフレーズ問題を緩和するために、カバレッジに注目したパラレルSeq 2 Seqネットワークを提案する。 具体的には、キーフレーズの言語的制約をソース側の基本Seq 2 Seqネットワークに統合し、ターゲット側のマルチタスク学習フレームワークを採用する。 また、キーフレーズの重複フレーズを正しい構文で生成することを防ぐため、カバレッジベクトルを導入し、注目履歴を追跡し、ソーステキストの一部が既存の生成キーフレーズでカバーされているかどうかを判断します。 実験結果は、我々の方法が科学的データセットにおいて最先端のCopyRNNを上回ることができ、ニュースドメインにおいてもより効果的であることを示している。Abstract
politenessoffpolite"), and when there is a change ("assertivepoliteness politenessoffpolite"), and when there is a change ("assertivepoliteness Nang pemilih iki, kita supoyo tambah Seq2Seq padha nganggo perusahaan kanggo ngubah ujaran kanggo ngerasakno ketahanan pangan. Laptop" and "Desktop politenessoffpolite"), and when there is a change ("assertivepoliteness Laptop" and "DesktopAbstract
გასაღების ფრაზები, რომლებიც საკუთარი დოკუმენტში განსაზღვრებულია დოკუმენტის საზოგადოება, ძალიან გამოიყენებელია ჩემი ენერგიის პროცესის უფრო დიდი პა თუმცა არსებობს კლავიფრაზის წარმოადგენის მეტივები ამ დავალების შესაძლებელი გამოყენება, ისინი ძალიან ძალიან ძალიან წარმოადგენა კლავიფრაზების წარმოადგენება (სუფრაზები ან სუფ ამ დოკუნეში ჩვენ მუშაობით პარალელი Seq2Seq ქსელი, რომელიც საკუთარი ინტერნეციას დაახლოებით საკუთარი ფრაზის პრობლემის გახსნა. განსაკუთრებით, ჩვენ კლავიფრაზის ლინგურისტიკური ზომილებების ინტერგურაციას გამოყენებთ საფეხური საქაღალდე Seq2Seq მხოლოდ და მრავალური დასწავლების კონფიგურაციას მისაღ დამატებით, კლავიფრაზების წესი სინტაქსით გადაწყვეტილებისთვის გადაწყვეტილებისთვის, ჩვენ შევცვალობთ საკუთარი გვექტორი, რომელიც დავხედავთ ინტერსტის ისტორია და გადაწყვეტილებისთვის, თუ არა მხოლოდ ექსპერიმენტიური შედეგი ჩვენი მეტი შეუძლია გავაკეთოთ უცნობიური მონაცემების კოპერიმენტის შედეგი და უფრო ეფექტიური მონაცემების დიომინში.Abstract
Құжатта талқылатын жоғары деңгейіндегі нақыштарды таңдайтын кілттер сөздері, табиғи тілдерді өзгерту тапсырмаларының көп аумағында өте пайдалы. Бұл тапсырманың басқа сөздерді құру әдістері өзгертілген әдістерін жеткізгенде, олар көптеген сөздерді (ішкі сөздерді немесе супер сөздерді қоса) жасайды. Бұл қағазда, біз параллелі Seq2Seq желіне жазылған мәселелерді көшірмелеу үшін мәселесін шешуге болады. Ескерінде, біз перне сөздің лингвистикалық шектеулерін көздегі Seq2Seq желіне ендіріп, көп тапсырманың оқыту фреймін мақсатты жағында қолданамыз. Қосымша, перне сөздерді дұрыс синтаксис арқылы түрлендіру үшін, мәтіннің бөлшектерін түрлендіру үшін, мәтіннің бөлшектері барлық құрылған перне сөздерге қатынау үшін мәтіннің бөлшектерін таңдап береміз. Эксперименталдық нәтижелер біздің әдіміміз ғылыми деректер жинақтарында CopyRNN күйін жасай алады, сондай-ақ сондай-ақ жаңалық доменде де әсер етеді.Abstract
관건적인 단어는 문서에서 토론한 고급 주제를 간단명료하게 묘사하여 광범위한 자연 언어 처리 임무에 매우 유용하다.비록 기존의 관건적인 단어 생성 방법은 이 임무에서 현저한 효과를 거두었지만, 그들은 많은 관건적인 단어의 중첩된 단어 (하위 단어나 슈퍼 단어 포함) 를 생성했다.본 논문에서 우리는 주의를 덮어쓰는 병렬 Seq2Seq 네트워크를 제시하여 겹치는 단어 문제를 완화시켰다.구체적으로 말하면 우리는 원본에서 키워드의 언어 제약을 기본적인 Seq2Seq 네트워크에 통합시키고 목표 측에서 다중 임무 학습 구조를 채택한다.또한 문법이 정확한 관건적인 단어의 중첩을 방지하기 위해 덮어쓰기 벡터를 도입하여 주의 역사를 추적하고 기존의 관건적인 단어가 원본 텍스트의 부분을 덮어쓰는지 확인합니다.실험 결과에 따르면 우리의 방법은 과학 데이터 세트에서 기존의 CopyRNN보다 성능이 우수하고 뉴스 분야에서도 더욱 효과적이다.Abstract
Keyphrases, that concisely describe the high-level topics discussed in a document, are very useful for a wide range of natural language processing tasks. Nors esami pagrindinių frazių kūrimo metodai šioje užduotyje pasiekė nemažai veiksmingų rezultatų, jie sukuria daugelį sutampančių frazių (įskaitant subprazes arba super frazes). Šiame dokumente siūlome lygiagretį Seq2Seq tinklą su aprėpties dėmesiu, kad būtų sušvelninta sutampančių frazių problema. Konkrečiai į pagrindinio Seq2Seq tinklo šaltinio pusę įtraukiame kalbinius pagrindinių frazių apribojimus ir taikome daugiafunkcinį mokymosi sistemą tikslinėje pusėje. Be to, siekiant užkirsti kelią sutampančioms raktų frazėms su teisinga sintaksu, įvedame aprėpties vektorių, kad stebėtume dėmesio istoriją ir nuspręstume, ar šaltinio teksto dalys buvo aprėptos esamomis sukauptomis raktų frazėmis. Eksperimentiniai rezultatai rodo, kad mūsų metodas gali viršyti pažangiausią kopijų RNN mokslo duomenų rinkiniuose ir yra veiksmingesnis naujienų srityje.Abstract
Клучните фрази, кои кратко ги опишуваат темите на високо ниво дискутирани во документот, се многу корисни за широк опсег на природни задачи за обработување јазици. Иако постојните методи за генерација на клучни фрази постигнаа извонредна извршност на оваа задача, тие генерираат многу прекривачки фрази (вклучително и подфрази или суперфрази) на клучните фрази. Во овој весник, предложуваме паралелна мрежа Seq2Seq со внимание на покривањето за олеснување на проблемот со прекривањето на фразите. Специфично, ги интегрираме јазичните ограничувања на клучната фраза во основната мрежа Seq2Seq на страната на изворот, и ја користиме рамката за учење на мултизадачи на страната на целта. Покрај тоа, со цел да се спречи да се генерираат прекривачки фрази на клучните фрази со точна синтаксија, ние го воведуваме векторот на покривање за да го следиме историјата на вниманието и да одлучиме дали деловите од изворот текст се покриени со постојните генерирани клучни фрази. Експерименталните резултати покажуваат дека нашиот метод може да го надмине најсовремениот CopyRNN на научните податоци, и исто така е поефикасен во новинскиот домен.Abstract
ഒരു രേഖയില് സംസാരിക്കപ്പെട്ട ഉയര്ന്ന നിലയിലെ പ്രധാനപ്പെട്ട വാക്കുകള് വിശദീകരിക്കുന്ന വാക്കുകള്, സ്വാഭാവിക ഭാഷ പ്രവര ഈ ജോലിയില് നിലവിലുള്ള കീവോര്ട്ട് തലമുറപ്പിക്കുന്ന രീതികള് പ്രവര്ത്തിപ്പിച്ചിരിക്കുന്നുവെങ്കിലും, കീവോര്ട്ടുകളുടെ (ഉപ- വാക് ഈ പത്രത്തില്, സെക്ക്2സെക്കിന്റെ പാരാളില് നിര്ദ്ദേശിക്കുന്ന സെക്സ് നെറ്റര് ശ്രദ്ധ കൊണ്ട് ഈ പേപ്പറില് വാക്ക പ്രത്യേകിച്ച്, നമ്മള് കീ വാക്കുകളുടെ നിയന്ത്രണങ്ങള് സെക്ക്2Seq നെറ്റര്വര്ക്കിലേക്ക് ഒരുമിച്ചുകൂട്ടുകയും, ലക്ഷ്യഭാഗത്ത് പല ജോലിയുടെ പഠി കൂടാതെ, ശരിയായ സിന്റാക്സുകൊണ്ട് കീവോര്ട്ടുകളുടെ വാക്കുകള് ഉയര്ത്തുന്നതില് നിന്നും മുന്കൂട്ടാന് ഞങ്ങള് പരിചയപ്പെടുത്തുന്നു, നിലവിലുള്ള ഉല്കൃഷ്ടി പരീക്ഷണ ഫലങ്ങള് കാണിച്ചു കൊണ്ടിരിക്കുന്നു നമ്മുടെ രീതിയില് ശാസ്ത്രീയ ഡാറ്റാസറ്റുകളില് നമ്മുടെ രീതിയില് പകര്പ്പുരാAbstract
Байгалийн хэл боловсруулах үйл ажиллагаанд маш их хэрэгтэй. Хэдийгээр сууж байгаа түлхүүр өгүүлбэрийн арга нь энэ ажил дээр гайхалтай үйл ажиллагааг гаргасан ч, тэд маш олон түлхүүр өгүүлбэрүүдийг (суб-өгүүлбэрүүд, супер-өгүүлбэрүүд) бий болгодог. Энэ цаасан дээр бид параллел Seq2Seq сүлжээг харуулах анхаарлыг багасгах гэж үздэг. Ялангуяа бид хэлний түлхүүр хэлбэрийн хязгаарлалтыг эх үүсвэрийн хэсэгт Seq2Seq сүлжээнд оруулж, олон үйл ажиллагааны суралцах хэлбэрийг зорилготой талд ашиглаж байна. Түүнчлэн, түлхүүрийн хэлбэрүүдийг зөв синтаксисаар давхарлахын тулд бид анхаарлын түүхийг хадгалахын тулд мэдээллийн векторыг танилцуулж, эх үүсвэрийн хэсгүүдийг суурилсан түлхүүрийн хэлбэрээр давхарлах эсэхийг шийдэх хэрэгтэй. Эмчилгээний үр дүнд бидний арга нь шинжлэх ухааны өгөгдлийн сангийн хувьд шинжлэх ухааны мэдээллийн хувьд илүү үр дүнтэй гэдгийг харуулж байна.Abstract
Frasa kunci, yang menjelaskan secara singkat topik tahap tinggi yang dibincangkan dalam dokumen, sangat berguna untuk julat luas tugas pemprosesan bahasa alami. Walaupun kaedah generasi frasa kunci yang wujud telah mencapai prestasi yang luar biasa pada tugas ini, mereka menghasilkan banyak frasa yang saling bertindih (termasuk sub-frasa atau super-frasa) bagi frasa kunci. Dalam kertas ini, kami cadangkan rangkaian Seq2Seq selari dengan perhatian meliputi untuk mengurangi masalah frasa yang meliputi. Secara khusus, kita mengintegrasikan keterangan bahasa frasa kunci ke dalam rangkaian asas Seq2Seq di sisi sumber, dan menggunakan rangkaian pembelajaran berbilang-tugas di sisi sasaran. Selain itu, untuk mencegah daripada menghasilkan frasa saling bertindih frasa kunci dengan sintaks yang betul, kami memperkenalkan vektor penyamaran untuk mengesan sejarah perhatian dan untuk memutuskan sama ada bahagian teks sumber telah ditutup oleh frasa kunci yang wujud. Hasil eksperimen menunjukkan bahawa kaedah kita boleh melampaui peringkat-peringkat CopyRNN pada set data saintifik, dan juga lebih berkesan dalam domain berita.Abstract
Il-frażijiet ewlenin, li jiddeskrivu b’mod konċiż is-suġġetti ta’ livell għoli diskussi f’dokument, huma utli ħafna għal firxa wiesgħa ta’ kompiti ta’ pproċessar tal-lingwi naturali. Għalkemm il-metodi eżistenti ta’ ġenerazzjoni ta’ frażijiet ewlenin kisbu prestazzjoni notevoli f’dan il-kompitu, jiġġeneraw ħafna frażijiet li jikkoinċidu (inklużi sottofrażijiet jew super frażijiet) ta’ frażijiet ewlenin. F’dan id-dokument, qed nipproponu n-netwerk parallel Seq2Seq bl-attenzjoni ta’ kopertura biex itaffu l-problema tal-frażi li tikkorrispondi. B’mod speċifiku, nintegraw ir-restrizzjonijiet lingwistiċi tal-frażi ewlenija fin-netwerk bażiku Seq2Seq fuq in-naħa tas-sors, u nimpjegaw il-qafas ta’ tagħlim multikompiti fuq in-naħa fil-mira. Barra minn hekk, sabiex jiġi evitat li jiġu ġġenerati frażijiet doppji ta’ frażijiet ewlenin b’sintaks korrett, aħna nintroduċu l-vettur ta’ kopertura biex in żommu t-traċċa tal-istorja tal-attenzjoni u biex niddeċiedu jekk il-partijiet tat-test tas-sors kinux koperti minn frażijiet ewlenin ġenerati eżistenti. Riżultati esperimentali juru li l-metodu tagħna jista’ jaqbeż l-aħħar CopyRNN fuq settijiet ta’ dejta xjentifiċi, u huwa wkoll aktar effettiv fid-dominju tal-aħbarijiet.Abstract
Sleutelzinnen, die de onderwerpen op hoog niveau die in een document worden besproken, beknopt beschrijven, zijn zeer nuttig voor een breed scala aan natuurlijke taalverwerkingstaken. Hoewel bestaande methoden voor het genereren van sleutelzinnen opmerkelijke prestaties hebben bereikt op deze taak, genereren ze veel overlappende zinnen (inclusief subzinnen of superzinnen) van sleutelzinnen. In dit document stellen we het parallelle Seq2Seq netwerk voor met de dekking aandacht om het overlappende frase probleem te verlichten. Specifiek integreren we de taalkundige beperkingen van sleutelzin in het basisSeq2Seq netwerk aan de bronzijde, en gebruiken we het multitask leerframework aan de doelkant. Om te voorkomen dat er overlappende zinnen van sleutelzinnen worden gegenereerd met de juiste syntaxis, introduceren we de dekkingsvector om de aandachtsgeschiedenis bij te houden en te beslissen of de delen van brontekst zijn gedekt door bestaande gegenereerde sleutelzinnen. Experimentele resultaten tonen aan dat onze methode beter kan presteren dan de state-of-the-art CopyRNN op wetenschappelijke datasets, en ook effectiever is in nieuwsdomein.Abstract
Nøkkelfrasar, som beskriver dei høg nivåemålene som er diskutert i eit dokument, er veldig nyttige for eit brett område av naturspråkshandsamar oppgåver. Selv om dei eksisterande metodane for oppretting av nøkkelfrasar har oppnådd merkelige utføringar på denne oppgåva, lagar dei mange overlapping frasar (inkludert underfrasar eller superfrasar) av nøkkelfrasar. I denne papiret foreslår vi den parallelle nettverket Seq2Seq med dekkefølgja til å løysa problem med overlapping av frasen. Spesielt integrerer vi den lingviske begrensene av nøkkelfrasen i den grunnleggjande nettverket Seq2Seq på kjeldesiden, og bruker det fleire oppgåver læringsrammeverket på målside. I tillegg, for å unngå å laga overlapping frasar av nøkkelfrasar med rett syntaks, introduserer vi dekkevektoren for å halda spor på oppmerkshistorien og bestemme om delene av kjeldeteksten er dekkede av eksisterande nøkkelfrasar. Eksperimentale resultat viser at metoden vårt kan utføra tilstanden av kunsten CopyRNN på vitenskapelige datasett, og er også meir effektiv i news domenet.Abstract
Zwroty kluczowe, które zwięzło opisują tematy wysokiego szczebla omawiane w dokumencie, są bardzo przydatne do szerokiego zakresu zadań przetwarzania języka naturalnego. Chociaż istniejące metody generowania fraz kluczowych osiągnęły niezwykłą wydajność w tym zadaniu, generują one wiele nakładających się fraz (w tym podfraz lub super fraz) fraz kluczowych. W niniejszym artykule proponujemy równoległą sieć Seq2Seq z uwzględnieniem zasięgu w celu złagodzenia nakładającego się problemu fraz. W szczególności integrujemy ograniczenia językowe frazy kluczowej z podstawową siecią Seq2Seq po stronie źródłowej, a po stronie docelowej stosujemy wielozadaniowy framework uczenia się. Dodatkowo, aby zapobiec generowaniu nakładających się fraz kluczowych o poprawnej składni, wprowadzamy wektor pokrycia, aby śledzić historię uwagi i zdecydować, czy części tekstu źródłowego zostały objęte istniejącymi generowanymi frazami kluczowymi. Wyniki eksperymentalne pokazują, że nasza metoda może przewyższyć state-of-the-art CopyRNN na zbiorach danych naukowych, a także jest bardziej skuteczna w dziedzinie wiadomości.Abstract
As frases-chave, que descrevem concisamente os tópicos de alto nível discutidos em um documento, são muito úteis para uma ampla variedade de tarefas de processamento de linguagem natural. Embora os métodos de geração de frases-chave existentes tenham alcançado um desempenho notável nessa tarefa, eles geram muitas frases sobrepostas (incluindo subfrases ou superfrases) de frases-chave. Neste artigo, propomos a rede paralela Seq2Seq com atenção de cobertura para aliviar o problema de sobreposição de frases. Especificamente, integramos as restrições linguísticas da frase-chave na rede Seq2Seq básica no lado de origem e empregamos a estrutura de aprendizado multitarefa no lado de destino. Além disso, para evitar a geração de frases sobrepostas de frases-chave com sintaxe correta, introduzimos o vetor de cobertura para acompanhar o histórico de atenção e decidir se as partes do texto-fonte foram cobertas por frases-chave geradas existentes. Os resultados experimentais mostram que nosso método pode superar o CopyRNN de última geração em conjuntos de dados científicos e também é mais eficaz no domínio de notícias.Abstract
Frazele cheie, care descriu concis subiectele de nivel înalt discutate într-un document, sunt foarte utile pentru o gamă largă de sarcini de procesare a limbajului natural. Deși metodele existente de generare a frazelor cheie au obținut performanțe remarcabile în această sarcină, ele generează multe fraze suprapuse (inclusiv subfraze sau super-fraze) ale frazelor cheie. În această lucrare, propunem rețeaua paralelă Seq2Seq cu atenție de acoperire pentru a atenua problema frazelor suprapuse. Mai exact, integrăm constrângerile lingvistice ale frazelor cheie în rețeaua de bază Seq2Seq pe partea sursă și utilizăm cadrul de învățare multi-task pe partea țintă. În plus, pentru a preveni generarea de fraze suprapuse de fraze cheie cu sintaxa corectă, introducem vectorul de acoperire pentru a ține evidența istoricului atenției și pentru a decide dacă părțile textului sursă au fost acoperite de fraze cheie generate existente. Rezultatele experimentale arată că metoda noastră poate depăși performanța de ultimă generație CopyRNN pe seturi de date științifice și este, de asemenea, mai eficientă în domeniul știrilor.Abstract
Ключевые фразы, которые кратко описывают темы высокого уровня, обсуждаемые в документе, очень полезны для широкого спектра задач по обработке естественного языка. Хотя существующие методы генерации ключевых фраз достигли замечательной производительности в этой задаче, они генерируют много перекрывающихся фраз (включая подфразы или суперфразы) ключевых фраз. В этой статье мы предлагаем параллельную сеть Seq2Seq с вниманием к охвату, чтобы облегчить проблему перекрывающихся фраз. В частности, мы интегрируем лингвистические ограничения ключевой фразы в базовую сеть Seq2Seq на стороне источника и используем многозадачный обучающий фреймворк на целевой стороне. Кроме того, чтобы предотвратить генерацию перекрывающихся фраз ключевых фраз с правильным синтаксисом, мы вводим вектор покрытия, чтобы отслеживать историю внимания и решать, были ли части исходного текста охвачены существующими сгенерированными ключевыми фразами. Экспериментальные результаты показывают, что наш метод может превзойти современный CopyRNN по научным наборам данных, а также более эффективен в области новостей.Abstract
වාර්තාවෙන් කතා කරලා තියෙන ප්රශ්නයක්, ස්වභාවික භාෂාව ප්රශ්නයක් ගොඩක් ප්රශ්නයක් විතරයි. ඔවුන් මේ වැඩේ ප්රශ්නයක් තියෙන්නේ යතුරු ප්රශ්නයක් ප්රශ්නයක් තියෙනවා නමුත්, ඔවුන් යතුරු ප්රශ්නයක් ගොඩක් ප්රශ් මේ පැත්තට, අපි සමාන්ය Seq2Seq ජාලය සමග ආවරණය අවධානය කරන්න පුළුවන් ප්රශ්නයක් අඩු කරන්න. විශේෂයෙන්, අපි යතුරු ප්රකාශයේ භාෂාවික වාර්තාවක් සම්බන්ධ කරනවා මූලික Seq2Seq ජාල පැත්තට, සහ ඉලක්ෂණ පැත්තට ගොඩක් ඒ වගේම, යතුරු ප්රවේශ සංකේතය සඳහා ප්රවේශයක් නිර්මාණය කරන්න ප්රතික්රියා කරන්න, අපි ආවරණය වෙක්ටර්ව ප්රවේශ කරනවා අවධානය ඉතිහාසයේ පරික්ෂ පරීක්ෂණාත්මක ප්රතිචාරයක් පෙන්වන්නේ අපේ විදියට විද්යාපිත විද්යාපිත විද්යාපිත විද්යාපිත විද්යාපිත වAbstract
Ključne fraze, ki jedrnato opisujejo teme na visoki ravni, obravnavane v dokumentu, so zelo uporabne za širok spekter nalog obdelave naravnega jezika. Čeprav so obstoječe metode ustvarjanja ključnih fraz dosegle izjemno uspešnost pri tej nalogi, ustvarjajo številne prekrivajoče se fraze (vključno s podfrazami ali super frazami) ključnih fraz. V tem prispevku predlagamo vzporedno omrežje Seq2Seq s pozornostjo pokritosti, da bi ublažili problem prekrivanja fraz. Natančneje vključujemo jezikovne omejitve ključnih fraz v osnovno omrežje Seq2Seq na izvorni strani, na ciljni strani pa uporabljamo večopravilni učni okvir. Poleg tega, da bi preprečili ustvarjanje prekrivajočih se fraz ključnih fraz s pravilno sintakso, uvajamo vektor pokritosti, da spremljamo zgodovino pozornosti in odločimo, ali so deli izvornega besedila pokriti z obstoječimi generiranimi ključnimi frazami. Eksperimentalni rezultati kažejo, da lahko naša metoda presega najsodobnejši CopyRNN na znanstvenih naborih podatkov in je učinkovitejša tudi na področju novic.Abstract
Erayada ku saabsan maadooyinka heerka sare ee warqadda looga hadlay waxay u faa’iido badan yihiin shaqooyin kala duduwan baaritaanka luuqada dabiicadda ah. In kastoo ay heystaan qaabab farshaxan ah oo ku qoran, waxay soo saaraan erayo badan oo la kordhiyey (包括hadal sub-phras ama af aad u badan). Warqaddan waxaan ka soo jeedaynaa shabakadda Seq2Seq ee lambarka ah, iyadoo aad u tahaysid daboolka si aan u fududayno dhibaatada ku saabsan hadalka. Si gaar ah, waxaynu u qabsanaynaa qoraalka luqada ah oo lagu qorayo shabakadda aasaasiga ah ee Seq2Seq dhinaca asalka ah, waxaana ku shaqaynaynaa koorasyada waxbarashada waxbarashada badan ee dhanka loogu talagalay. Intaas waxaa dheer, si aan uga hor joogsado ka sameynta hadallada ku qoran saxda kaararka ah, waxaynu soo bandhignaa wado daboolka si aan u raadsanno taariikhda warqada iyo inaan go'aanno in qeybaha laga koobo qoraalka sourceed ay ku qoran yihiin erayada aad heysato. Imtixaanka waxaa muuqda in qaabkeennu uu ka sameyn karo xaaladda qoraalka ee qofka qoraalka ah ee CopyRNN, wuxuuna sidoo kale ka faa’iido badan yahay xafiiska warbixinta.Abstract
Frazat kyçe, që përshkruajnë në mënyrë të shkurtër temat e nivelit të lartë të diskutuar në një dokument, janë shumë të dobishme për një gamë të gjerë detyrash natyrore të përpunimit të gjuhës. Megjithëse metodat ekzistuese të gjenerimit të frazave kyçe kanë arritur performancë të shquar në këtë detyrë, ato gjenerojnë shumë fraza të mbishtypura (duke përfshirë nënfraza apo super fraza) të frazave kyçe. Në këtë letër, ne propozojmë rrjetin paralel Seq2Seq me vëmendjen e mbulimit për të lehtësuar problemin e përshpëritjes së frazëve. Veçanërisht, ne integrojmë kufizimet gjuhësore të frazës kyçe në rrjetin bazë Seq2Seq në anën e burimit, dhe përdorim kuadrin e mësimit me shumë detyra në anën e objektivit. Përveç kësaj, me qëllim që të parandalojmë nga krijimi i frazave të kapërcyera të frazave kyçe me sintaksë korrekte, ne futim vektorin e mbulimit për të mbajtur gjurmën e historisë së vëmendjes dhe për të vendosur nëse pjesët e tekstit burimor janë mbuluar nga frazat kyçe ekzistuese të gjeneruara. Experimental results show that our method can outperform the state-of-the-art CopyRNN on scientific datasets, and is also more effective in news domain.Abstract
Ključne fraze, koje potpuno opisuju teme visokog nivoa raspravljene u dokumentu, veoma su korisne za širok niz prirodnih zadataka za obradu jezika. Iako postojeće metode generacije ključnih fraza postigle su izvanredne funkcije na ovom zadatku, oni stvaraju mnoge preklapajuće fraze (uključujući podfraze ili super fraze) ključnih fraza. U ovom papiru predlažemo paralelnu mrežu Seq2Seq sa prikrivenom pažnjom da ublažimo problem preklapanja fraze. Posebno, integriramo jezičke ograničenje ključne fraze u osnovnu mrežu Seq2Seq na izvornoj strani, i upotrebimo okvir učenja više zadataka na ciljnoj strani. Osim toga, kako bismo spriječili da proizvedemo preklapanje rečenica ključnih fraza sa pravim sintaksom, predstavljamo vektor pokrivanja da prati povijest pažnje i odlučimo da li su dijelovi izvornog teksta pokriveni postojećim proizvedenim ključnim frazama. Eksperimentalni rezultati pokazuju da naš metod može izvršiti državu umjetnosti CopyRNN na naučnim setima podataka, a takođe je efikasniji u novinskom domenu.Abstract
Nyckelfraser, som kortfattat beskriver de högnivåämnen som diskuteras i ett dokument, är mycket användbara för ett brett spektrum av naturliga språkbehandlingsuppgifter. Även om befintliga metoder för generering av nyckelfraser har uppnått anmärkningsvärda prestanda i denna uppgift, genererar de många överlappande fraser (inklusive underfraser eller supersraser) av nyckelfraser. I denna uppsats föreslår vi det parallella Seq2Seq-nätverket med täckningsuppmärksamhet för att lindra överlappande frasproblem. Specifikt integrerar vi nyckelfrasernas språkliga begränsningar i det grundläggande Seq2Seq-nätverket på källsidan, och använder multi-task learning ramverket på målsidan. Dessutom, för att undvika att generera överlappande fraser av nyckelfraser med korrekt syntax, introducerar vi täckningsvektorn för att hålla reda på uppmärksamhetshistoriken och för att avgöra om delarna av källtexten har täckts av befintliga genererade nyckelfraser. Experimentella resultat visar att vår metod kan överträffa det senaste CopyRNN på vetenskapliga datauppsättningar, och är också effektivare inom nyhetsområdet.Abstract
Neno, ambazo zinaelezea mada za juu zilizojadiliwa katika nyaraka, zinafaa sana kwa kazi nyingi za upasuaji wa lugha za asili. Ingawa mbinu za uzalishaji wa maneno yaliyopo tayari zimekuwa za kutekeleza kazi hii, wanatengeneza maneno mengi yanayozidisha (ikiwa ni pamoja na maneno ya chini au maneno mengi ya juu). Katika karatasi hii, tunapendekeza mtandao wa Seq2Seq uliofanana na habari hizo ili kupunguza tatizo la msemo uliopita. Specifically, we integrate the linguistic constraints of keyphrase into the basic Seq2Seq network on the source side, and employ the multi-task learning framework on the target side. Kwa nyongeza, ili kuzuia kuzuia maneno ya maneno yanayotumiwa na kodi sahihi, tunaonyesha vector ya habari ili kuendelea kufuatilia historia ya ufuatiliaji na kuamua ikiwa sehemu za maandishi ya vyanzo vimefunika na maneno yaliyozaliwa. Matokeo ya majaribio yanaonyesha kuwa mbinu yetu inaweza kutengeneza hali ya sanaa ya CopyRNN kwenye seti za kisayansi, na pia ina ufanisi zaidi katika maeneo ya habari.Abstract
ஆவணத்தில் விளக்கப்பட்ட உயர்நிலை தலைப்பு இருக்கும் விசைச்சொற்றொடர் உருவாக்கும் முறைமைகள் இந்த செயல்பாட்டில் செயல்படுத்தப்பட்டுள்ளதாலும், அவர்கள் பல மேல் மேலேற்படுத்தும் சொற்றொடர இந்த காகிதத்தில், Seq2Seq இணைப்பு வலைப்பின்னலை மறைக்கப்படும் சொற்றொடர் சொற்றொடர் பிரச்சினையை நீக்குவதற்கு முன்னோட குறிப்பிட்டு, நாம் விசைச்சொற்றொடரின் மொழியின் கட்டுப்பாடுகளை அடிப்படை Seq2Seq வலைப்பின்னலில் ஒன்று சேர்க்க, மற்றும் இலக்கு பக்கத்தில் பல பண மேலும், சரியான ஒத்திசைவுடன் விசைச்சொற்றொடர்களின் மேல் மூடுதல் சொற்றொடர்களை உருவாக்க தடுக்க வேண்டும் என்றால், நாம் கவனத்தின் வரலாற்றை பாதுகாப்பிடுவதற்கு பரிசோதனை முடிவுAbstract
Sened içinde taryşan ýokary dereje meýdanlary tasvir eden kiçi sözler, tebigy diller işlemek üçin örän peýdalydyr. Öň bar faýllaryň önüminde esasy täzelikleri bu täzelikde örän möhüm eserden täze boldy, faýllaryň üstünde birnäçe daşlap frazleri döredir. Bu kagyzda, biz Seq2Seq şebekesini örän ünsüni çykarmak üçin parallel sany teklip berýäris. Adatça, biz kellämiziň lingwistiki buýruklaryny kaynak tarapynda Seq2Seq şebekesine üýtgedýäris we maksadyň üstünde birnäçe-täbli öwrenme framyny ulanýarys. Beýleki, kelläp frazleriniň üstüne geçirmekden çykarmak üçin, biz ördek vektörünü göz önüne tutmak üçin we çeşme metiniň parçalarynyň bolan tär frazler tarapyndan örtülendirilip karar vermek üçin girişdiririk. Experimental netijelerimiz bilim sistemasynda sungatçylyk (CC BY-NC-2.0).Abstract
Keyphrases, which conclusively describe the high-level topics discussed in a document, are very useful for a wide range of natural language processing tasks. Though existing keyphrase generation methods have achieved remarkable performance on this task, they generate many overlapping phrases (including sub-phrases or super-phrases) of keyphrases. اس کاغذ میں، ہم سک2سک نیٹ ورک کے ساتھ مشکل کو آسان کرنے کے لئے مشکل کے ساتھ مشکل کے مطابق مشکل کے ساتھ مشکل کریں گے. خاص طور پر، ہم کلی فریز کی زبان کی تنظیمات کو سورس کے کنارے میں سq2Seq نیٹورک میں جمع کرتے ہیں، اور موقع کے کنارے پر multi-task learning framework استعمال کرتے ہیں. اور اس کے علاوہ، کیفی فریز کے اورلپ پینگ فریز کو درست سینٹکسس کے ساتھ پیدا کرنے سے روکتے ہیں، ہم نے کاوٹر ویکتور کو اظہار تاریخ کے ترک کرنے کے لئے پیش کیا ہے اور فیصلہ کرنے کے لئے ہے کہ کیا سورج ٹکس کے حصے موجود کیفی فریز کے ذریعے پورے ہوئے ہیں. آزمائش نتائج دکھاتے ہیں کہ ہمارا طریقہ سائنسیٹ ڈیٹسٹ پر سائنسیٹ کی کاپیٹر RNN کو اضافہ کر سکتا ہے اور نیویس ڈیمین میں بھی اضافہ بھی ہےAbstract
Name @ info: whatsthis Bu hujjatda, biz Seq2Seq tarmoqning parallel tarmoqni tahlil qilamiz va soʻzni koʻpaytirish muammolarini kamaytirish mumkin. Ko'rsatilgan, biz lugʻlik tugmalar tarkibini asosiy Seq2Seq tarmoqdagi asosiy tarmoqga birlashtiramiz, va bir necha vazifa o'rganishni qanday qilamiz. Koʻrsatgich, to ʻgʻri syntax bilan tugmalar birikmasini yuklashdan oldin, tugmalar tarkibini tahrirlash va mavjud yaratilgan tugmalar birikmasini qo'yishga qarang. Tajriba natijalari esa, bizning usuli ilmiy maʼlumot sahifalarini saqlash imkoniyatini bajarishimiz mumkin, va u faqat yangi xabar domain davomida ko'proq ishlaydi.Abstract
Những cụm từ, miêu tả ngắn gọn các vấn đề cấp cao được thảo luận trong một tài liệu, rất hữu ích cho một loạt các công việc xử lý ngôn ngữ tự nhiên. Mặc dù các phương pháp tạo từ điển thành ngữ đã đạt hiệu quả đáng chú ý trong nhiệm vụ này, chúng tạo ra nhiều cụm từ khác nhau (trong đó có phần dưới hoặc cụm từ siêu) của các cụm từ khác. Trong tờ giấy này, chúng tôi đề xuất mạng Sep2Seq tương đồng với sự quan tâm che đậy để giảm sự chồng chéo các cụm từ. Cụ thể, chúng ta sẽ nhập các giới hạn ngôn ngữ của lối diễn đạt vào hệ thống Seq2Seq cơ bản nằm bên đầu, và áp dụng hệ thống học tập nhiều nhiệm vụ ở mặt mục tiêu. Thêm vào đó, để tránh việc tạo ra các cụm từ từ từ từ khoá với cú pháp chính xác, chúng tôi sẽ giới thiệu véc- tơ bao để theo dõi lịch sử sự chú ý và để quyết định liệu các phần của văn bản nguồn đã được chứa các cụm từ cơ bản đã tạo sẵn. Kết quả thí nghiệm cho thấy phương pháp của chúng ta có thể vượt trội hơn bản sao trên các dữ liệu khoa học, và cũng hiệu quả hơn trong lĩnh vực tin tức.Abstract
简举文档之高第短语于诸自然语言处分甚有用。 虽有要短语成法,取显于此,而生重短语(子短语超级短语)。 本文并行Seq2Seq网络覆,以纾重短语。 具体来说者,短语言整合源端之本Seq2Seq网络,而用多任务于趋端框架。 又防生成正语法之要短语,引入覆向量以踵意历史记录,定其本体已成键短语覆。 实验结果表明法在科学数集上可以优先进之CopyRNN,而新闻域益效。- Anthology ID:
- P19-1515
- Volume:
- Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics
- Month:
- July
- Year:
- 2019
- Address:
- Florence, Italy
- Venue:
- ACL
- SIG:
- Publisher:
- Association for Computational Linguistics
- Note:
- Pages:
- 5224–5233
- Language:
- URL:
- https://aclanthology.org/P19-1515
- DOI:
- 10.18653/v1/P19-1515
- Bibkey:
- Cite (ACL):
- Jing Zhao and Yuxiang Zhang. 2019. Incorporating Linguistic Constraints into Keyphrase Generation. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pages 5224–5233, Florence, Italy. Association for Computational Linguistics.
- Cite (Informal):
- Incorporating Linguistic Constraints into Keyphrase Generation (Zhao & Zhang, ACL 2019)
- Copy Citation:
- PDF:
- https://aclanthology.org/P19-1515.pdf
- Data
- KP20k
- Terminologies:
Export citation
@inproceedings{zhao-zhang-2019-incorporating, title = "Incorporating Linguistic Constraints into Keyphrase Generation", author = "Zhao, Jing and Zhang, Yuxiang", booktitle = "Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics", month = jul, year = "2019", address = "Florence, Italy", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/P19-1515", doi = "10.18653/v1/P19-1515", pages = "5224--5233", }
<?xml version="1.0" encoding="UTF-8"?> <modsCollection xmlns="http://www.loc.gov/mods/v3"> <mods ID="zhao-zhang-2019-incorporating"> <titleInfo> <title>Incorporating Linguistic Constraints into Keyphrase Generation</title> </titleInfo> <name type="personal"> <namePart type="given">Jing</namePart> <namePart type="family">Zhao</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Yuxiang</namePart> <namePart type="family">Zhang</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <originInfo> <dateIssued>2019-07</dateIssued> </originInfo> <typeOfResource>text</typeOfResource> <relatedItem type="host"> <titleInfo> <title>Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics</title> </titleInfo> <originInfo> <publisher>Association for Computational Linguistics</publisher> <place> <placeTerm type="text">Florence, Italy</placeTerm> </place> </originInfo> <genre authority="marcgt">conference publication</genre> </relatedItem> <identifier type="citekey">zhao-zhang-2019-incorporating</identifier> <identifier type="doi">10.18653/v1/P19-1515</identifier> <location> <url>https://aclanthology.org/P19-1515</url> </location> <part> <date>2019-07</date> <extent unit="page"> <start>5224</start> <end>5233</end> </extent> </part> </mods> </modsCollection>
%0 Conference Proceedings %T Incorporating Linguistic Constraints into Keyphrase Generation %A Zhao, Jing %A Zhang, Yuxiang %S Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics %D 2019 %8 July %I Association for Computational Linguistics %C Florence, Italy %F zhao-zhang-2019-incorporating %R 10.18653/v1/P19-1515 %U https://aclanthology.org/P19-1515 %U https://doi.org/10.18653/v1/P19-1515 %P 5224-5233
Markdown (Informal)
[Incorporating Linguistic Constraints into Keyphrase Generation](https://aclanthology.org/P19-1515) (Zhao & Zhang, ACL 2019)
- Incorporating Linguistic Constraints into Keyphrase Generation (Zhao & Zhang, ACL 2019)
ACL
- Jing Zhao and Yuxiang Zhang. 2019. Incorporating Linguistic Constraints into Keyphrase Generation. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pages 5224–5233, Florence, Italy. Association for Computational Linguistics.