The Paradigm Discovery Problem Name መግለጫ مشكلة اكتشاف النموذج Paradigm Discovery Problemi Проблемът с откриването на парадигма প্যারাডিগম ডিস্কারি সমস্যা ས Paradigm རྙེད་སྤེལ་བའི་དཀའ་ངལ་ Problem s rastavljanjem paradigma The Paradigm Discovery Problem Problém objevení paradigma Paradigm Discovery Problemet Das Problem der Paradigmentdeckung Το πρόβλημα ανακάλυψης παραδείγματος Paradigm Discovery problem Paradigmi avastamise probleem مشکل کشیدن پارادیگ Paradigmin etsintäongelma Problèmes de découverte de paradigmes The Paradigm Discovery Problem KCharselect unicode block name בעיית גילוי הפרדיגמה पैराडिग्म डिस्कावरी समस्या Problem s otkrivanjem paradigma A Paradigm felfedezési probléma Պարադիգման հայտնաբերման խնդիրը Masalah Penemuan Paradigm Il problema della scoperta del Paradigm パラダイム発見問題 Ora negori arah sing peringkamu nggawe პარადიგმის განსხვავება პრობლემა Парадигм байқау мәселесі 모범 발견 문제 Paradigmo atradimo problema Проблемот за откривање на парадигмите പാരാഡിഗം ഡിസ്ക്വറി പ്രശ്നം Парадигм олох асуудал Masalah Penemuan Paradigm Il-problema tal-iskoperta tal-Paradigma Het Paradigma Ontdekkingsprobleem Paradigm- oppdagingsproblem Problem odkrycia paradygmatu O Problema da Descoberta do Paradigma Problema descoperirii Paradigmului нормированное обнаружение проблем පැරැඩිග්ම් හොයාගන්න ප්රශ්න Problem odkrivanja paradigme Dhibaatooyinka baaritaanka baaritaanka Problemi i zbulimit të Paradigmit Problem sa rastavljanjem paradigma Problemet med upptäckten av Paradigm Tatizo la Kugundua Uchunguzi Paradigm கண்டுபிடிப்பு பிரச்சனை Paradigm Araşdyrma Mesele بہشت کا مشکل ہے The Paradigm Discovery Problem Vấn đề vặt vãnh 范式发现问题
Alexander Erdmann, Micha Elsner, Shijie Wu, Ryan Cotterell, Nizar Habash
Abstract
This work treats the paradigm discovery problem (PDP), the task of learning an inflectional morphological system from unannotated sentences. We formalize the PDP and develop evaluation metrics for judging systems. Using currently available resources, we construct datasets for the task. We also devise a heuristic benchmark for the PDP and report empirical results on five diverse languages. Our benchmark system first makes use of word embeddings and string similarity to cluster forms by cell and by paradigm. Then, we bootstrap a neural transducer on top of the clustered data to predict words to realize the empty paradigm slots. An error analysis of our system suggests clustering by cell across different inflection classes is the most pressing challenge for future work.Abstract
Hierdie werk behandel die paradigme ontdekking probleem (PDP), die taak van leer van 'n infleksionele morfologiese stelsel van onbekende setinge. Ons formaliseer die PDP en ontwikkel evalueringsmetries vir oordeel stelsels. Gebruik ons huidiglik beskikbare hulpbronne, konstrukteer ons datastelle vir die taak. Ons stel ook 'n heuristiese benchmark vir die PDP en rapporteer empiriese resultate op vyf verskeie tale. Ons benchmark stelsel maak eerste gebruik van woord inbêding en string gelykbaarheid aan cluster vorms deur sel en deur paradigm. Dan, ons begin 'n neurale oordragter op die top van die klosterde data om woorde te voorskou om die leë paradigme plekke te bevestig. 'n Fout-analisie van ons stelsel stel voorstel om deur sel te klosteer oor verskillende inflekking klasse is die mees drukkende uitdrukking vir toekomstige werk.Abstract
ይህ ሥራ የፍላጎት ግጭት (PDP)፣ የማያስተማር የሞፎሎጂ ስርዓት ከስርዓት መማር ስራ ነው፡፡ PDP አካባቢ እናደርጋለን እና የድምፅ ምርጫዎችን ለመፍጠር እናደርጋለን፡፡ በአሁኑ ጊዜ የተገኘ ሀብት በመጠቀም ጊዜ ለስራው ዳታዎችን እንሠራለን፡፡ እናም ለPDP የኦርቲክ ወረቀት እናደርጋለን፡፡ የbenchmark ስርዓታችን መጀመሪያ ቃሎችን አካባቢዎች እና ቀለሞች በክፍል እና በክፍል ጥረቶችን ለመቀነስ ይችላል፡፡ ከዚህም በኋላ የናቡር ሰንሰራዊ ተቃውሞ ባዶ ተለዋሚዎች መሆኑን ለማወቅ ቃላትን ለመቀበል እናስቀምጣለን፡፡ An error analysis of our system suggests clustering by cell across different inflection classes is the most pressing challenge for future work.Abstract
يعالج هذا العمل مشكلة اكتشاف النموذج (PDP )، وهي مهمة تعلم نظام مورفولوجي انعكاسي من جمل غير مشروحة. نقوم بإضفاء الطابع الرسمي على PDP وتطوير مقاييس التقييم لأنظمة الحكم. باستخدام الموارد المتاحة حاليًا ، نقوم بإنشاء مجموعات بيانات للمهمة. كما نضع معيارًا إرشاديًا لـ PDP ونقدم تقريرًا عن النتائج التجريبية على خمس لغات متنوعة. يستخدم نظامنا المعياري أولاً تضمين الكلمات وتشابه الأوتار مع أشكال المجموعات حسب الخلية والنموذج. بعد ذلك ، نقوم بربط محول طاقة عصبي فوق البيانات المجمعة للتنبؤ بالكلمات لتحقيق فتحات النموذج الفارغة. يشير تحليل الخطأ في نظامنا إلى أن التجميع حسب الخلية عبر فئات التحويل المختلفة هو التحدي الأكثر إلحاحًا للعمل المستقبلي.Abstract
Bu işin paradigm keşif problemi (PDP) ilə, tanımadıqları cümlələrdən inflektiv bir morfolojik sistemini öyrənmək məqsədilə təşkil edir. Biz PDP'yi formalizə edirik və mühakimə sistemləri üçün değerləşdiririk. Hazırda mövcud resurslar istifadə edirik, iş üçün verilən qurğular inşa edirik. Biz də PDP üçün heuristik bir benchmark təyin edirik və beş cür dillərə empirik sonuçlarını bildiririk. Bizim benchmark sistemimiz ilk dəfə kelimelərlə birləşdirilmək və qovluğu hücre və paradigm kimi istifadə edir. Sonra, bir nöral tərcümcüsünün üstündə bir nöral tərcümcüsünü çəkirik ki, boş paradigm yerlərini anlamaq üçün sözləri təmin edək. Sistemimizin xəta analizi hüceyrə ilə müxtəlif infleksyon sınıflarının arasında clustering göstərilir ki, gələcək işlər üçün ən təsirli challengedir.Abstract
Тази работа разглежда проблема с откриването на парадигмата (ДПП), задачата за изучаване на флексионна морфологична система от неописани изречения. Ние формализираме ПДП и разработваме измервателни показатели за системи за оценяване. Използвайки наличните понастоящем ресурси, ние конструираме набори от данни за задачата. Ние също така разработваме евристичен бенчмарк за ПДП и докладваме емпирични резултати на пет различни езика. Нашата референтна система първо използва вграждането на думи и приликата на низове с групови форми по клетки и парадигма. След това стартираме неврален трансдуктор върху групираните данни, за да предскажем думите, за да реализираме празните парадигми слотове. Анализът на грешките на нашата система предполага, че групирането по клетки в различни класове на флексия е най-належащото предизвикателство за бъдещата работа.Abstract
এই কাজটি প্যারাডিম আবিষ্কারের সমস্যাকে চিকিৎসা করে (পিডিপি), অজ্ঞাত শাস্তি থেকে একটি প্রভাবিত মরোফোলজিক্যাল সিস্টে আমরা পিডিপি বিন্যাসের জন্য মূল্যবান মেট্রিক উন্নয়ন করি। বর্তমানে উপস্থিত সম্পদ ব্যবহার করে, আমরা কাজের জন্য ডাটাসেট নির্মাণ করি। আমরা পিডিপির জন্য একটি হারিস্টিক বেনম্যার্ক তৈরি করেছি এবং পাঁচটি বিভিন্ন ভাষায় ক্ষমতার ফলাফল প্রতিবেদন করি। আমাদের বেনম্যার্ক সিস্টেম প্রথমে শব্দ ব্যবহার করে এবং স্ট্রিঙ্গের সাথে সেল এবং প্যারাডিমের মাধ্যমে স্থাপন করার তারপর, আমরা একটি নিউরেল ট্রান্সপ্ল্যান্স্টার্স্ট্র্যান্স্ট্র্যান্স্ট্র্যান্স্ট্র্যাক্ট করে ফাঁকা প্যারাড আমাদের সিস্টেমের একটি ত্রুটি বিশ্লেষণ পরামর্শ প্রদান করেছে যে বিভিন্ন প্রভাবের শ্রেণীর মধ্যে কোন ক্লাসের সাথে সেAbstract
འདི་གིས་སྔོན་ལྟ་བ་དེ་རྒྱུན་ལྡན་གྱི་དཀའ་ངལ་རྙེད་ཚུལ་ལས་ཕན་ཚུན་འབྲེལ་གྱི་མ་ལག་ཅིག་སྦྱར་བ་དང་། ང་ཚོས་PDP་ལ་སྔོན་འཛུགས་བྱེད་བཞིན་བྱེད་པར་ཨ་རིའི་ཚད་རྩིས་འབྲས་བྱེད་ཀྱི་ཡོད། མིག་སྔ ང་ཚོས་PDP ལ་རྗེས་སུ་འབྱུང་ཚད་ལྡན་རིམ་པ་ཞིག་བཟོ་བྱེད་ཀྱི་ཡོད། ང་ཚོའི་བརྒྱུད་ལམ་ལུགས་འདི་དང་པོ་མཐའ་ཡིག་གི་སྒྲ་ཚིགས་ནང་མཐུད་པ་དང་མཐུན་རྣམས་མཐུན་པ་ལྟར་བྱེད་ཀྱི་ཡོད། དེ་ནས་འུ་ཚོས་ཀླད་པའི་མཐོ་རིམ་སྣུམ་གྱི་རྩིས་འཁོར་ཐོག་ཏུ་སྒོ་གཏོང་གི་ཐབས་ལམ་སྔོན་སྒྲིག་ཡིག་ཆ་སྟོང་བ་དང་། ང་ཚོའི་མ་ལག་གི་དབྱེ་ཞིབ་ཀྱི་ནོར་འཁྲུལ་ཞིག་གིས་སྒུལ་གྱི་འཛིན་རིས་མ་འདྲ་བར་བསམ་བློ་གཏོང་རྒྱུ་དང་།Abstract
Ovaj rad tretira problem otkrivanja paradigma (PDP), zadatak učenja inflekcionalnog morfološkog sistema iz neoznačenih rečenica. formaliziramo PDP i razvijemo procjenu metrike za suđenje. Koristeći trenutno dostupne resurse, izgradimo komplete podataka za zadatak. Također smislimo i heurističku kritiku PDP-a i prijavimo empiričke rezultate na pet različitih jezika. Naš standardni sistem prvo koristi riječi ugrađenja i sličnost rečenica sa oblicima skupljanja po ćeliji i paradigmom. Onda ćemo prebaciti neuralni prevoditelj na vrh skupljenih podataka da predvidimo riječi da shvatimo prazne paradigme mjesta. Analiza greške našeg sistema ukazuje na skupljanje ćelija u raznim raznim časovima inflekcije najteži izazov za budući rad.Abstract
Aquesta feina tracta el problema de descobriment de paradigmes (PDP), la tasca d'aprendre un sistema morfològic inflexional a partir de frases no notades. We formalize the PDP and develop evaluation metrics for judging systems. Utilitzant els recursos actualment disponibles, construïm conjunts de dades per a la tasca. També dissenyem un punt de referència heurístic per al PDP i reportem resultats empírics en cinc llengües diverses. El nostre sistema de referència utilitza primer les integracions de paraules i la similitud de cadenes a les formes de grups per cèl·lula i per paradigma. Then, we bootstrap a neural transducer on top of the clustered data to predict words to realize the empty paradigm slots. Una anàlisi d'errors del nostre sistema suggereix que agrupar per cèl·lula en diferents classes d'inflexió és el repte més pressiu per al treball futur.Abstract
Tato práce se zabývá problematikou objevu paradigmatu (PDP), úkolem učení flexiálního morfologického systému z nezapsaných vět. Formalizujeme PDP a vyvíjíme hodnotící metriky pro posuzovací systémy. Na základě aktuálně dostupných zdrojů sestavujeme datové sady pro daný úkol. Navrhujeme heuristický benchmark pro PDP a vykazujeme empirické výsledky v pěti různých jazycích. Náš benchmarkový systém nejprve využívá vkládání slov a řetězcové podobnosti s clusterovými formami podle buňky a podle paradigmatu. Potom spouštíme neuronový převodník na shlukovaná data, abychom předpověděli slova k realizaci prázdných paradigmatických slotů. Analýza chyb našeho systému naznačuje, že shlukování podle buněk napříč různými třídami inflekce je nejnaléhavější výzvou pro budoucí práci.Abstract
Dette arbejde behandler paradigmeopdagelsesproblemet (PDP), opgaven med at lære et bøjleformelt system ud fra ubestemte sætninger. Vi formaliserer PDP'en og udvikler evalueringsmålinger til bedømmelsessystemer. Ved hjælp af aktuelt tilgængelige ressourcer konstruerer vi datasæt til opgaven. Vi udarbejder også et heuristisk benchmark for PDP og rapporterer empiriske resultater på fem forskellige sprog. Vores benchmark system gør først brug af ordindlejringer og streng lighed til klyngeformer efter celle og paradigme. Derefter starter vi en neural transducer oven på de klyngede data for at forudsige ord for at realisere de tomme paradigme slots. En fejlanalyse af vores system tyder på, at klyngning efter celle på tværs af forskellige bøjningsklasser er den mest presserende udfordring for fremtidigt arbejde.Abstract
Diese Arbeit behandelt das Paradigma Discovery Problem (PDP), die Aufgabe, aus unbenotierten Sätzen ein flektionales morphologisches System zu lernen. Wir formalisieren das PDP und entwickeln Bewertungsmetriken für Bewertungssysteme. Aus aktuell verfügbaren Ressourcen erstellen wir Datensätze für die Aufgabe. Außerdem erarbeiten wir einen heuristischen Benchmark für die PDP und berichten empirische Ergebnisse zu fünf verschiedenen Sprachen. Unser Benchmark-System nutzt zunächst Worteinbettungen und String-Ähnlichkeit zu Clusterformen nach Zelle und Paradigma. Dann booten wir einen neuronalen Wandler auf die Clusterdaten, um Wörter vorherzusagen, um die leeren Paradigmaslots zu realisieren. Eine Fehleranalyse unseres Systems deutet darauf hin, dass die Clusterung nach Zelle über verschiedene Flexionsklassen hinweg die drängendste Herausforderung für zukünftige Arbeiten ist.Abstract
Η παρούσα εργασία ασχολείται με το πρόβλημα ανακάλυψης παραδείγματος (ΠΠΠ), το έργο της εκμάθησης ενός εκφυλιστικού μορφολογικού συστήματος από μη σημειωμένες προτάσεις. Τυποποιούμε το PDP και αναπτύσσουμε μετρήσεις αξιολόγησης για συστήματα αξιολόγησης. Χρησιμοποιώντας τους διαθέσιμους πόρους, κατασκευάζουμε σύνολα δεδομένων για την εργασία. Επίσης, σχεδιάζουμε ένα heuristic benchmark για το PDP και αναφέρουμε εμπειρικά αποτελέσματα σε πέντε διαφορετικές γλώσσες. Το σύστημα αναφοράς μας χρησιμοποιεί πρώτα τις ενσωματώσεις λέξεων και την ομοιότητα συμβολοσειρών με τις μορφές συμπλέγματος ανά κελί και ανά παράδειγμα. Στη συνέχεια, ενεργοποιούμε έναν νευρικό μετατροπέα πάνω από τα συγκεντρωμένα δεδομένα για να προβλέψουμε λέξεις για να συνειδητοποιήσουμε τις κενές αυλακώσεις παραδείγματος. Μια ανάλυση σφαλμάτων του συστήματός μας υποδηλώνει ότι η ομαδοποίηση ανά κύτταρο σε διαφορετικές κατηγορίες καμπής είναι η πιο πιεστική πρόκληση για τη μελλοντική εργασία.Abstract
Este trabajo aborda el problem a del descubrimiento de paradigmas (PDP), la tarea de aprender el sistema morfométrico inflexible en oraciones nunca anotadas. Formalizamos el PDP y desarrollamos indicadores de evaluación para juzgar el sistema. Con los recursos disponibles actualmente, construimos conjuntos de datos para la tarea. También diseñamos un Benchmark heurístico para PDP y reportamos resultados empíricos en cinco idiomas diferentes. En primer lugar, nuestro sistema de Benchmarking utiliza la incrustación de palabras y la similitud de cadenas para agrupar por unidad y paradigma. Luego guiamos un sensor Neural en la parte superior de los datos de agrupamiento para predecir palabras para implementar una ranura de ejemplo vacía. El análisis de errores de nuestro sistema muestra que el agrupamiento celular a través de diferentes categorías de puntos de inflexión es el desafío más urgente en el trabajo futuro.Abstract
Käesolevas töös käsitletakse paradigma avastamise probleemi (PDP), mille ülesanne on õppida paindlikku morfoloogilist süsteemi märkimata lausetest. Formaliseerime PDP ja arendame hindamismeetodeid hindamissüsteemide jaoks. Kasutades praegu olemasolevaid ressursse, loome ülesande jaoks andmekogumid. Samuti töötame välja heuristilise võrdlusaluse PDP jaoks ja esitame empiirilised tulemused viie erineva keele kohta. Meie võrdlussüsteem kasutab esmalt sõna manustamist ja stringide sarnasust klastrivormidega lahtri ja paradigma kaupa. Seejärel käivitame neuraalse anduri klastrite peale, et ennustada sõnu, et realiseerida tühjad paradigma pesad. Meie süsteemi veaanalüüs näitab, et erinevate inflektsiooniklasside klastrite kaupa rühmitamine rakkude kaupa on tulevase töö jaoks kõige pakilisem väljakutse.Abstract
این کار مشکل کشف پارادیگ (PDP) را درمان میکند، وظیفه یاد گرفتن یک سیستم مورفولوژیک تحت تاثیر از جملههای غیر شناخته است. ما PDP را رسمی سازیم و متریک ارزیابی برای سیستمهای قضاوت توسعه میکنیم. با استفاده از منابع موجود در حال حاضر، مجموعههای دادهها برای این کار ساختیم. ما همچنین یک نقطهبندی هوریستیک برای PDP طراحی میکنیم و نتایج امپراتیک را در پنج زبان مختلف گزارش میدهیم. اول سیستم ابزار ما از ابزار کلمههای ابزار و شباهت string با فرمهای کلاستر به سلول و پارادیگ استفاده میکند. سپس، ما یک ترجمه عصبی را روی اطلاعات کلاستری میبندیم تا کلمات را پیش بینی کنیم تا جاهای پارادیگ خالی را درک کنیم. یک تحلیل اشتباهی از سیستم ما پیشنهاد میدهد که کلاسهای مختلف تأثیر تأثیرگیری از سلولها در کلاسهای مختلف است که بهترین چالشهای فشار برای کار آینده است.Abstract
Tässä työssä käsitellään paradigmalöydön ongelmaa (PDP), joka on tehtävä oppia taivutettu morfologinen järjestelmä merkitsemättömistä lauseista. Muodostamme PDP:n ja kehitämme arviointimittareita arviointijärjestelmiin. Tällä hetkellä käytettävissä olevien resurssien avulla rakennamme tehtävään aineistoja. Kehitämme myös heuristisen vertailuarvon PDP:lle ja raportoimme empiirisiä tuloksia viidellä eri kielellä. Vertailujärjestelmämme hyödyntää ensin sanaupotuksia ja merkkijonojen samankaltaisuutta klusterimuotoihin soluittain ja paradigmaittain. Sitten käynnistämme hermoanturin klusteroidun datan päälle ennustamaan sanoja ja toteuttamaan tyhjät paradigmapaikat. Järjestelmämme virheanalyysi viittaa siihen, että solukohtainen klusterointi eri inflktioluokkien välillä on kiireellisin haaste tulevalle työlle.Abstract
Ce travail traite des problèmes de découverte de paradigmes (PDP), c'est - à - dire de la tâche d'apprendre les systèmes morphologiques inflexibles dans une phrase non annotée. Nous formalisons le PDP et développons des indicateurs d'évaluation pour juger le système. En utilisant les ressources actuellement disponibles, nous construisons des ensembles de données pour la tâche. Nous avons également conçu un référentiel heuristique pour le PDP et nous avons présenté des résultats empiriques dans cinq langues différentes. Notre système d'étalonnage utilise d'abord l'intégration de mots et la similarité des chaînes pour regrouper les unités et les paradigmes. Ensuite, nous guidons un capteur neuronal en haut des données groupées pour prédire les mots afin d'obtenir une fente d'instance vide. L'analyse des erreurs de notre système montre que le regroupement cellulaire entre différentes catégories de points d'inflexion est le défi le plus urgent dans les travaux futurs.Abstract
This work treats the paradigm discovery problem (PDP), the task of learning an inflectional morphological system from unannotated sentences. We formalize the PDP and develop evaluation metrics for judging systems. Agus acmhainní atá ar fáil faoi láthair á n- úsáid againn, tógáimid tacair sonraí don tasc. Déanann muid tagarmharc héiristiúil don PDP freisin agus tuairiscimid torthaí empiriciúla ar chúig teanga éagsúla. Déanann ár gcóras tagarmharcanna úsáid ar dtús as leabaithe focal agus comhchosúlacht teaghrán le foirmeacha clustera de réir celí agus de réir paradigme. Then, we bootstrap a neural transducer on top of the clustered data to predict words to realize the empty paradigm slots. An error analysis of our system suggests clustering by cell across different inflection classes is the most pressing challenge for future work.Abstract
Wannan aikin yana tunkuɗe wa fitina na paradigm (PDP), aikin da aka sani wani na'urar mutfologi na masu husũma daga cire da ba'a taƙaita ba. Tunasar da PDP kuma za'a buɗa metric muhalli wa masu yin hukunci na'ura. Yi amfani da manyan amfani da wanda ke da yanzu, za'a samu tsari masu amfani da aikin. Tuna ƙayyade wani heuristic bangon wa PDP kuma Muke jarraba matsalar mai amfani da fassara kan harshen shan dabam-daban. @ info: whatsthis Sa'an nan kuma, za mu fara wani mai transmitori na neural a kan saman data wanda aka samu da shi dõmin Mu yi bayani ga kalmõmi da za'a gane slottori masu buƙata. An error analysis of our system suggests clustering by cell across different inflection classes is the most pressing challenge for future work.Abstract
העבודה הזו מטפלת בבעיית גילוי הפרדיגמה (PDP), המשימה ללמוד מערכת מורפולוגית משפטים בלתי נבונים. אנחנו פורמלים את PDP ופתחים מטריות הערכה לשפוט מערכות. באמצעות משאבים זמינים כרגע, אנו בונים קבוצות נתונים למשימה. אנחנו גם מתכננים רמז היוריסטי עבור PDP ולדווח על תוצאות אמפיריות על חמש שפות מגוונות. מערכת המרכזים שלנו קודם משתמשת בתכניות מילים ודומות של חוטים לצורות קבוצות על פי תאים ופרדיגמה. Then, we bootstrap a neural transducer on top of the clustered data to predict words to realize the empty paradigm slots. ניתוח שגיאות של המערכת שלנו מצביע על ידי תא להתקבל על ידי תאים במערכות השליכות שונות הוא האתגר המדחף ביותר לעבודה עתידית.Abstract
यह कार्य पैराडिग्म शोध समस्या (पीडीपी) का उपयोग करता है, अज्ञात वाक्यों से एक प्रभावित मॉर्फिकलोजिक तंत्र सिखाने की हम पीडीपी को आधारित करते हैं और न्याय सिस्टमों के लिए परिमाण मेट्रिक्स को विकास करते हैं। मौजूदा उपलब्ध संसाधन के प्रयोग कर रहे हैं, हम कार्य के लिए डाटा सेट बनाते हैं. हम पीडीपी के लिए हेउरिस्टिस्ट बेंचमार्क बनाते हैं और पांच विविध भाषा पर इम्पारिक परिणाम का रिपोर्ट करें। हमारा बेंचमार्क सिस्टम पहले शब्द अंबेडिंग और स्ट्रिंग के अनुसार क्लास्टर फॉर्मों के अनुसार कक्ष और पैराडिग्म क फिर हम एक न्यूराल ट्रांसड्यूकर को क्लास्टरेड डाटा के ऊपर बुटस्ट्रैप कर रहे हैं कि शब्दों को पूर्वावलोकन करने के लिए खाली पै हमारे सिस्टम का एक त्रुटि विश्लेषण सुझाता है कि कक्ष के द्वारा कोशिका क्लास्टरिंग भिन्न प्रभाव क्लासों में भीAbstract
Ovaj rad tretira problem otkrivanja paradigma (PDP), zadatak učenja inflekcionalnog morfološkog sustava iz neoznačenih rečenica. formaliziramo PDP i razvijemo mjere procjene za sustave sudjenja. Koristeći trenutno dostupne resurse, izgradimo podatke za zadatak. Također smo smislili i heurističku kritiku PDP-a i prijavili empiričke rezultate na pet različitih jezika. Naš standardni sustav prvo koristi riječi ugrađenje i sličnost rečenica u klasternim oblicima stanica i paradigma. Onda ćemo osloboditi neuralnog prevoditelja na vrh skupljenih podataka da predvidimo riječi da shvatimo prazne paradigme mjesta. Analiza greške našeg sustava ukazuje na skupljanje stanica u različitim klasama inflekcije najteži izazov za budući rad.Abstract
A munka a paradigmafelvizsgáló problémát (PDP), az inflexiós morfológiai rendszer tanulásának feladatát foglalja magában. formalizáljuk a PDP-t és kifejlesztjük az értékelési mutatókat a bíráló rendszerekhez. A jelenleg rendelkezésre álló erőforrások felhasználásával adatkészleteket építünk a feladathoz. Kidolgozunk egy eurisztikai referenciaértéket a PDP-hez, és empirikus eredményeket jelentünk öt különböző nyelven. Benchmark rendszerünk először a szóbeágyazásokat és a klaszter formákhoz hasonló karakterláncokat használja fel cellánként és paradigmánként. Ezután elindítunk egy neurális átalakítót a klaszterezett adatok tetejére, hogy megjósoljuk a szavakat, hogy megvalósítsuk az üres paradigmahelyeket. A rendszerünk hibaelemzése azt sugallja, hogy a különböző hajlékonysági osztályok közötti klaszterezés a legsürgetőbb kihívás a jövőbeli munka számára.Abstract
Այս աշխատանքը վերաբերում է պարադիգմային հայտնագործման խնդիրը (PDP), որը նպատակն է սովորել աննկարագրված նախադասություններից ներխուժող մորֆոլոգիական համակարգ: Մենք կազմակերպում ենք PDP-ը և զարգանում ենք գնահատման մետրիկներ համակարգերի դատողության համար: Օգտագործելով ներկայումս հասանելի ռեսուրսները, մենք կառուցում ենք տվյալների համակարգեր այս խնդրի համար: Մենք նաև ստեղծում ենք PDP-ի հորիստիկ համեմատական նպատակ և զեկուցում ենք էմպրիկական արդյունքներ հինգ տարբեր լեզուների վրա: Our benchmark system first makes use of word embeddings and string similarity to cluster forms by cell and by paradigm. Այնուհետև մենք տեղադրում ենք նյարդային հաղորդիչը հավաքված տվյալների վերևում, որպեսզի կանխագուշակենք բառերը, որպեսզի հասկանանք դատարկ պարադիգմային վայրերը: Մեր համակարգի սխալների վերլուծությունը ցույց է տալիս, որ բջիջների խմբավորումը տարբեր ազդեցության դասերի միջև ամենաճնշող մարտահրավերն է ապագա աշխատանքի համար:Abstract
Pekerjaan ini memperlakukan masalah penemuan paradigma (PDP), tugas untuk mempelajari sistem morfologi inflectional dari kalimat yang tidak dicatat. Kami formalisasi PDP dan mengembangkan metrik evaluasi untuk menilai sistem. Using currently available resources, we construct datasets for the task. Kami juga membuat benchmark heuristik untuk PDP dan melaporkan hasil empiris pada lima bahasa yang berbeda. Sistem benchmark kita pertama-tama membuat penggunaan embedding kata dan persamaan string dengan bentuk cluster oleh sel dan paradigma. Kemudian, kita bootstrap transducer saraf di atas data berkumpul untuk memprediksi kata-kata untuk menyadari slot paradigm a kosong. An error analysis of our system suggests clustering by cell across different inflection classes is the most pressing challenge for future work.Abstract
Questo lavoro tratta il paradigma discovery problem (PDP), il compito di imparare un sistema morfologico inflessionale da frasi non notate. formalizziamo il PDP e sviluppiamo metriche di valutazione per i sistemi di valutazione. Utilizzando le risorse attualmente disponibili, costruiamo set di dati per l'attività. Elaboriamo anche un benchmark euristico per il PDP e riportiamo risultati empirici su cinque lingue diverse. Il nostro sistema di benchmark utilizza innanzitutto le incorporazioni di parole e la somiglianza di stringhe alle forme di cluster per cella e per paradigma. Poi, avviamo un trasduttore neurale in cima ai dati cluster per prevedere le parole per realizzare gli slot paradigmatici vuoti. Un'analisi degli errori del nostro sistema suggerisce che il clustering per cella attraverso diverse classi di flessione è la sfida più urgente per il lavoro futuro.Abstract
本研究では,無作為化された文から感情形態素システムを学習するタスクパラダイム発見問題(pdp)を扱う。pdpを定式化し,判定システムの評価メトリクスを開発した。現在利用可能なリソースを使用して、タスクのデータセットを構築します。また、PDPのための発見的ベンチマークを考案し、5つの多様な言語に関する経験的結果を報告する。我々のベンチマークシステムは,まず,セル埋め込みとストリング類似性をセルによるパラダイムとパラダイムにより利用する。次に,クラスタ化データの上にニューラルトランスデューサをブートストラップし,空のパラダイムスロットを実現するための単語を予測する。我々のシステムのエラー解析は、異なる変倍クラスの向こう側のセルによるクラスタリングが将来の仕事のために最も圧迫挑戦であることを示唆します。Abstract
Ombudhakan wong kuwi nggawe perbudhakan kanggo nggawe geranggap paradigim (PNP), nggawe ngupakan sistem sing nyenggap modorolôgan karo ceduluran gak nggambar obah-obahan. Awak dhéwé ngerti prelimisasi PNP lan nggawe sistem kanggo nggawe barang-barang. Ngawe Perintah pengguna sing wis ana, kita nggawe dataset kanggo nggawe task. Awak dhéwé mulai nggawe bendhèkan hekirstik kanggo nggawe PNP lan balik dhéwé empirstik kanggo limo sing kalah-kalah basa. Kernel Iyo kiper, awak dhéwé nyumbang ana luwih dumaten ning acara dadi sing perusahaan kanggo ngerasai gambaran kanggo ngerasai pasar dumateng. Eror kanggo ngeralasi sistem sing paling nggambar kelas kuwi kapan kelas sing gak benerAbstract
ეს სამუშაო პარადიგმის პრობლემა (PDP) დააკვირდება, ინფრექციონალური მორპოლოგიური სისტემის შესწავლობა, რომელიც უცნობილი სიტყვებისგან. ჩვენ PDP-ს ფორმალურად გავაკეთებთ და გავაკეთებთ განსაზღვრების მეტრიკა სისტემებისთვის. მიმდინარე ხელსაწყოთა რესურსის გამოყენება, ჩვენ დავაკეთებთ მონაცემების კონფიგურაცია. ჩვენ ასევე დავიწყეთ ჰეურისტიკური ბანქმარი PDP-ს და გამოყენებთ ემპერიკური შედეგები ხუთი განსხვავებული ენაზე. ჩვენი ბენქმარკური სისტემა პირველად გამოყენება სიტყვების ჩვენება და სიტყვების სხვადასხვადასხვადასხვადასხვადასხვადასხვადასხვადასხვადასხვადასხვადასხვა ფორმე შემდეგ ჩვენ ნეიროლური ტრანსექტურის მარცხენა კლასტერის მონაცემების მარცხენა დავიწყებთ სიტყვები, რომელიც გავიგებთ ცარიელი პარადიგმა სიტყვები. ჩვენი სისტემის შეცდომის ანალიზაცია იგივეა, რომ კოსტერაცია კოსტერაციის განსხვავებული ინფლექციის კლასების განსხვავებული კოსტერაციის განსხვავებაში არის ყAbstract
Бұл жұмыс парадигм анықтау мәселесін (PDP) қалады, беймәлім мәселелерден инффекциялық морфологиялық жүйесін оқыту тапсырмасы. Біз PDP-ді оқыту жүйелерінің оқыту метрикаларын оқыту үшін оқыту. Қолданыстағы ресурстар қолданылса, тапсырманың деректер жиындарын құрамыз. Мұндай-ақ біз PDP үшін геуристикалық белгілі тілдерінде империялық нәтижелерді таңдап береміз. Біздің банкмарк жүйесіміз біріншіден сөздерді ендіру мен жолдардың ұяшықтар мен парадигмізге ұқсас пішімдеріне ұқсас етеді. Содан кейін, біз кластерлі деректердің үстінде неврал аударғышын сөздерді бос парадигм слоттарын түсінуге болады. Біздің жүйеміздің қате анализиясы ұяшықтардың басқа инфлекциялық классында кластерлеу үшін болашақ жұмыс істеу үшін ең жақын мәселе болады.Abstract
이 작업 처리 패턴은 주석을 달지 않은 문장에서 굴절 형태 시스템을 배우는 임무를 발견한다.우리는 PDP를 형식화하고 평가 시스템을 위해 평가 지표를 개발할 것이다.현재 사용 가능한 자원을 사용하여 우리는 임무를 위해 데이터 집합을 구축합니다.또한 PDP를 위한 계발식 기준을 설계하고 다섯 가지 언어의 실증 결과를 보고했습니다.우리의 기준 테스트 시스템은 우선 단어 삽입과 문자열의 유사성을 이용하여 단원과 범례에 따라 분류한다.그리고 우리는 모인 데이터에 신경 센서를 유도하여 단어를 예측하여 빈 범례조를 실현한다.우리 시스템에 대한 잘못된 분석에 따르면, 서로 다른 전환점 유형을 뛰어넘는 세포 집합은 미래 작업에서 가장 긴박한 도전이다.Abstract
Šiuo darbu sprendžiama paradigmos atradimo problema (PDP), užduotis mokytis inflekcinės morfologinės sistemos iš nenotiruotų sakinių. Mes formalizuojame PDP ir kuriame vertinimo sistemų vertinimo rodiklius. Naudodami šiuo metu turimus išteklius, sukuriame užduoties duomenų rinkinius. Taip pat parengiame heuristinį PDP lyginamąjį tašką ir pateikiame empirinius rezultatus penkiomis įvairiomis kalbomis. Mūsų lyginamoji sistema pirmiausia naudoja žodžių įterpimus ir juostų panašumą į klasterines formas pagal ląsteles ir paradigm ą. Tuomet įjungiame nervų transdutorių virš surinktų duomenų, kad nuspėtume žodžius, kad suprastų tuščius paradigmos slotus. An error analysis of our system suggests clustering by cell across different inflection classes is the most pressing challenge for future work.Abstract
Оваа работа го третира проблемот со откривањето на парадигмите (ПДП), задачата да се научи инфекционален морфолошки систем од незабележани реченици. Го формализираме ПДП и развиваме метрика за проценка на системите. Користејќи ги моментално достапните ресурси, конструираме податоци за задачата. Ние, исто така, создаваме хеористичка референција за ПДП и известуваме емпириски резултати на пет различни јазици. Нашиот систем за споредба прво ги користи зборовите внатрешни и врските сличности со групираните форми по ќелија и по парадигма. Потоа, ќе ставиме нервен трансдукер врз групираните податоци за да предвидеме зборови за да ги сфатиме празните парадигмски места. Анализата на грешките на нашиот систем покажува дека групирањето по ќелии низ различни класи на инфекција е најитниот предизвик за идната работа.Abstract
ഈ പ്രവര്ത്തിക്കുന്നത് പാരാഡിമി കണ്ടുപിടിക്കുന്ന പ്രശ്നം (പിഡിപി) പ്രശ്നമാക്കുന്നു. വാക്കുകളില് നിന്നും ഒരു സ് നമ്മള് പിഡിപിപിയെ രൂപപ്പെടുത്തുകയും വിധിക്കുന്നതിനുള്ള വിലാസങ്ങള് മെറ്റിക്കുകയും ചെയ്യും. ഇപ്പോള് ലഭ്യമായ വിഭവങ്ങള് ഉപയോഗിക്കുന്നു, ജോലിക്കുള്ള ഡാറ്റാസറ്റുകള് നാം നിര്മ്മിക്ക പിഡിപിപിയ്ക്ക് വേണ്ടി ഒരു ഹെയ്രിസ്റ്റിക്ക് ബെന്ച്മാര്ക്ക് നാം നിര്മ്മിക്കുകയും അഞ്ച് വിവിധ ഭാഷകള നമ്മുടെ ബെന്ച്മാര്ക്ക് സിസ്റ്റം ആദ്യം വാക്കുകളുടെ അകത്തേക്കുള്ള വാക്കുകളും സ്ട്രിങ്ങും സെല് കൊണ്ടും പാര പിന്നെ നമ്മള് ഒരു ന്യൂറല് ട്രാന്സ്സ്റ്റര് സ്ട്രാപ്റ്റര് ചെയ്യുന്നു. ശൂന്യമായ വിവരങ്ങള് പ്രവചിക്കാന് വാക്ക An error analysis of our system suggests clustering by cell across different inflection classes is the most pressing challenge for future work.Abstract
Энэ ажил парадигм нээлттэй асуудлыг (PDP), мэдэгдэхгүй өгүүлбэрээс нөлөөлдөг морфологик системийг сурах ажил юм. Бид PDP-г загварчлаад шүүмжлэх системийн шалгалтын метриктикийг хөгжүүлнэ. Одоогоор хэрэглэгддэг нөөцийг ашиглан, бид ажлын өгөгдлийн сангуудыг бүтээж байна. Мөн бид PDP-ийн хувьд хэмжээний хувьд хэмжээний эзэмшигийн үр дүнг таван төрлийн хэл дээр тайлбарлаж байна. Эхлээд бидний банк-марк систем эс болон парадигм дээр хэлбэртэй адилхан хэлбэрийг ашигладаг. Дараа нь бид мэдрэлийн дамжуулагч нь хоосон парадигм талуудыг ойлгохын тулд хэлэх өгөгдлийн дээр шилжүүлдэг. Бидний системийн алдаа асуудлын шинжилгээ нь эсээс өөр өөр нөлөөлөлтийн хичээл дээр бүрдүүлэх нь ирээдүйн ажлын хамгийн чухал сорилт юм.Abstract
Kerja ini memperlakukan masalah penemuan paradigma (PDP), tugas untuk mempelajari sistem morfologi pengaruh dari kalimat yang tidak dicatat. Kami formalkan PDP dan mengembangkan metrik penilaian untuk menilai sistem. Menggunakan sumber yang tersedia, kita membina set data untuk tugas ini. Kami juga membuat benchmark heuristik untuk PDP dan laporkan hasil empirik pada lima bahasa yang berbeza. Sistem tanda rujukan kita pertama-tama menggunakan penyambungan perkataan dan persamaan rentetan kepada bentuk kumpulan mengikut sel dan paradigma. Kemudian, kita pasang transducer saraf di atas data berkumpul untuk meramalkan perkataan untuk menyadari slot paradigm a kosong. Analisis ralat sistem kita menunjukkan kelompok mengikut sel melalui kelas pengangkutan yang berbeza adalah tantangan yang paling penting untuk kerja masa depan.Abstract
Dan ix-xogħol jittratta l-problema tal-iskoperta tal-paradigma (PDP), il-kompitu li titgħallem sistema morfoloġika inflezzjonali minn sentenzi mhux innotati. Aħna nifformalizzaw il-PDP u niżviluppaw metriċi ta’ evalwazzjoni għas-sistemi ta’ ġudizzju. Bl-użu tar-riżorsi disponibbli bħalissa, nibnu settijiet ta’ dejta għall-kompitu. We also devise a heuristic benchmark for the PDP and report empirical results on five diverse languages. Is-sistema ta’ referenza tagħna l-ewwel tagħmel użu mill-inkorporazzjonijiet tal-kliem u s-similarità tal-linji għall-forom ta’ raggruppament skont iċ-ċellola u skont il-paradigma. Imbagħad, a ħna nibdew trażdutur newrali fuq id-dejta raggruppata biex nipprojbixxu l-kliem biex nirrealizzaw is-slots vojta tal-paradigm a. Analiżi ta’ żbalji tas-sistema tagħna tissuġġerixxi li l-raggruppament skont iċ-ċelluli f’klassijiet differenti ta’ inflezzjoni huwa l-isfida l-aktar urġenti għax-xogħol futur.Abstract
Dit werk behandelt het paradigma discovery problem (PDP), de taak om een flexioneel morfologisch systeem te leren van ongenoteerde zinnen. We formaliseren het PDP en ontwikkelen evaluatiestatistieken voor beoordelingssystemen. Met behulp van momenteel beschikbare resources bouwen we datasets voor de taak. Daarnaast ontwikkelen we een heuristische benchmark voor het PDP en rapporteren we empirische resultaten op vijf verschillende talen. Ons benchmark systeem maakt eerst gebruik van woord embeddings en string gelijkenis met clustervormen per cel en per paradigma. Vervolgens bootsen we een neurale transducer bovenop de geclusterde data om woorden te voorspellen om de lege paradigmaslots te realiseren. Een foutanalyse van ons systeem suggereert dat clustering per cel over verschillende buigingsklassen de meest urgente uitdaging is voor toekomstig werk.Abstract
Dette arbeidet behandler problemet for oppdaging av paradigm (PDP), oppgåva for å lære eit infleksjonell morfologisk system frå utgjeven setningar. Vi formaliserer PDP og utviklar evalueringsmetrikn for sprøytsystemet. Bruk tilgjengelege ressursar, konstruerer vi datasett for oppgåva. Vi finn også ein heuristisk benchmark for PDP-en og rapporterer empiriske resultat på fem ulike språk. Vårt benchmarksystemet først brukar ordinnbygging og strenglikhet til clusterformar ved celle og paradigm. Så startar vi ein neuraltransduktor på toppen av klosterte data for å foregå ord for å oppfylle dei tomme paradigmsplassene. Ein feilanalyse av systemet vårt foreslår at klassering av celler i ulike infleksjonsklassar er den mest trykkande utfordringen for framtidige arbeid.Abstract
W niniejszej pracy podejmuje się problem odkrywania paradygmatu (PDP), zadanie nauki reflekcyjnego systemu morfologicznego z niezapisanych zdań. Formalizujemy PDP i opracowujemy wskaźniki oceny systemów oceniających. Korzystając z aktualnie dostępnych zasobów, budujemy zbiory danych do zadania. Opracowujemy również heurystyczny benchmark dla PDP i raportujemy wyniki empiryczne na pięciu różnych językach. Nasz system referencyjny wykorzystuje najpierw osadzenia słów i podobieństwo ciągów do form klastrowych według komórek i paradygmatu. Następnie uruchamiamy przetwornik neuronowy na górze danych grupowych, aby przewidzieć słowa, aby zrealizować puste gniazda paradygmatu. Analiza błędów naszego systemu sugeruje, że grupowanie według komórek w różnych klasach przekształcenia jest najpilniejszym wyzwaniem dla przyszłych prac.Abstract
Este trabalho trata do problema da descoberta de paradigmas (PDP), a tarefa de aprender um sistema morfológico flexional a partir de sentenças não anotadas. Formalizamos o PDP e desenvolvemos métricas de avaliação para sistemas de julgamento. Usando recursos disponíveis atualmente, construímos conjuntos de dados para a tarefa. Também elaboramos um benchmark heurístico para o PDP e relatamos resultados empíricos em cinco línguas diversas. Nosso sistema de referência primeiro faz uso de incorporação de palavras e similaridade de strings com formas de cluster por célula e por paradigma. Em seguida, inicializamos um transdutor neural em cima dos dados agrupados para prever palavras para realizar os slots de paradigma vazios. Uma análise de erro do nosso sistema sugere que agrupar por célula em diferentes classes de inflexão é o desafio mais premente para trabalhos futuros.Abstract
Această lucrare tratează problema descoperirii paradigmei (PDP), sarcina de a învăța un sistem morfologic inflexional din propoziții neanotate. Formalizăm PDP și dezvoltăm măsurători de evaluare pentru sistemele de judecată. Folosind resursele disponibile în prezent, construim seturi de date pentru activitate. De asemenea, elaborăm un reper euristic pentru PDP și raportăm rezultate empirice pe cinci limbi diferite. Sistemul nostru de referință utilizează mai întâi încorporarea cuvintelor și similitudinea șirurilor cu formele de cluster pe celulă și pe paradigmă. Apoi, pornim un traductor neural deasupra datelor grupate pentru a prezice cuvinte pentru a realiza fantele de paradigmă goale. O analiză a erorilor a sistemului nostru sugerează clusterizarea pe celulă în diferite clase de inflexiune este cea mai presantă provocare pentru lucrările viitoare.Abstract
Эта работа направлена на решение проблем, связанных с установлением парадигмы (PDP), т.е. Мы оформили PGP и разработали оценочные показатели для системы оценки. используя имеющиеся ресурсы, мы создаем набор данных для задач. Мы также разработали эвристический эталон для ППП и представили информацию о фактических результатах на пяти различных языках. наша система контрольных испытаний сначала использует слова, встроенные и строковые сходства для группирования по элементам и парадигмам. Затем мы направляем нейронный датчик на вершину агрегата, чтобы предсказать слова, чтобы достичь пустого образца. анализ ошибок, допущенных в нашей системе, показывает, что кластеризация клеток, пересекающих различные точки соприкосновения, является самой неотложной задачей в будущей работе.Abstract
මේ වැඩේ පාර්ඩිග්ම් හොයාගන්න ප්රශ්නයක් (PDP), ප්රශ්නයක් ප්රශ්නයක්, ප්රශ්නයක් ප්රශ්නයක් ප්රශ්නයක අපි PDP එක ප්රමාණය කරනවා ඒ වගේම පද්ධතිය විශ්වාස කරන්න විශ්වාස මෙට්රික්ස් විස්තර කරනවා. දැන් පුළුවන් උපකරණය භාවිතා කරනවා, අපි වැඩ සඳහා දත්ත සෙට් හදනවා. අපි පිලිපි වලට හෙයුරිස්ටික් බෙන්ච්මාර්ක් සැලසුම් කරනවා ඒ වගේම විවිධ භාෂාවක් පහක් වලට අධික අපේ බෙන්ච්මාර්ක් පද්ධතිය පටන් ගත්තේ පද්ධතිය සහ ස්ට්රින්ට් වර්ගය සමාන වර්ගයෙන් පාවිච්චි කරනවා. ඊට පස්සේ, අපි න්යූරාල් ප්රවේශකයෙක් බුට්ස්ට්රෑප් කරනවා කොල්ස්ටර් තොරතුරු ඉහළට වචනය අනුවෙන් වචනය තේරුම් අපේ පද්ධතියේ විශ්ලේෂණයක් ප්රශ්නයක් ප්රශ්නය කරනවා වෙනස් ප්රශ්නයක් ප්රශ්නයක් විතරයි අනාගතය වැඩAbstract
Delo obravnava problem odkrivanja paradigme (PDP), nalogo učenja inflekcijskega morfološkega sistema iz neopisovanih stavkov. Formaliziramo PDP in razvijamo ocenjevalne metrike za sisteme ocenjevanja. Z uporabo trenutno razpoložljivih virov gradimo nabore podatkov za opravilo. Prav tako oblikujemo heuristično merilo za PDP in poročamo empirične rezultate na petih različnih jezikih. Naš referenčni sistem najprej uporablja vgradnje besed in podobnost nizov z oblikami gruč po celicah in paradigmi. Nato zaženemo nevronski pretvornik na vrhu združenih podatkov, da napovedamo besede in uresničimo prazne reže paradigme. Analiza napak našega sistema kaže, da je združevanje po celicah v različnih infleksijskih razredih najbolj pereč izziv za prihodnje delo.Abstract
Shaqadaasu wuxuu u baaraandegaa dhibaatada baaritaanka ah (PDP), shaqada ku barashada nidaamka morfologiga ee aan la aqoon. Waxaynu sameynaa PDP waxaana horumarinnaa qaabab qiimeynta nidaamka lagu xukumo. Isku isticmaalaya isticmaalka howlaha la isticmaalayo, waxaynu u sameynaa sawirada macluumaadka shaqada. Sidoo kale waxaynu qornaynaa qoraal qoraal ah oo PDP ku qoran, waxaana wargelinaynaa matooyin ku saabsan shan luuqadood oo kala duduwan. Sida ugu horeysa nidaamka bangiga ayaa isticmaalaya hadal ku habboon iyo xadhig u eg si ay u soo kordhiyaan foomka midowga cellada iyo paradigm. Then, we bootstrap a neural transducer on top of the clustered data to predict words to realize the empty paradigm slots. Baaritaanka qaladka ee nidaamkayaga waxaa looga jeedaa in cellada lagu soo dhaqaajiyo fasalka kala duwan oo saameyn ah waa dhibaatada ugu daran ee shaqada mustaqbalka ah.Abstract
Ky punë trajton problemin e zbulimit të paradigm ës (PDP), detyrën e mësimit të një sistemi morfologjik të pashmangshëm nga fjalimet e pa shënuara. Ne formalizojmë PDP dhe zhvillojmë metrikat e vlerësimit për gjykimin e sistemeve. Duke përdorur burimet aktualisht të disponueshme, ne ndërtojmë grupe të dhënash për detyrën. Ne gjithashtu hartojmë një referencë heuristike për PDP dhe raportojmë rezultatet empirike në pesë gjuhë të ndryshme. Sistemi ynë referues fillimisht bën përdorimin e përfshirjes së fjalëve dhe ngjashmërisë së rreshtave me format e grupit sipas qelizave dhe paradigm ës. Then, we bootstrap a neural transducer on top of the clustered data to predict words to realize the empty paradigm slots. Një analizë e gabimeve të sistemit tonë sugjeron se grupimi me qeliza nëpër klasa të ndryshme rrjedhjesh është sfida më e rëndësishme për punën e ardhshme.Abstract
Ovaj rad tretira problem otkrivanja paradigma (PDP), zadatak učenja inflekcionalnog morfološkog sistema iz neoznačenih rečenica. Mi formaliziramo PDP i razvijamo procjenu metrike za suđenje. Koristeći trenutno dostupne resurse, izgradimo sete podataka za zadatak. Takoðe smo smislili i heurističku kritiku za PDP-u i prijavili empiričke rezultate na pet različitih jezika. Naš standardni sistem prvo koristi reèi ukljuèujuæi i sliènost reèi sa oblicima skupljanja po ćelijama i paradigmom. Onda ćemo staviti neuralni prevoditelj na vrh skupljenih podataka da predvidimo reči da shvatimo prazne paradigme mjesta. Analiza greške našeg sistema ukazuje na skupljanje ćelija u raznim klasama inflekcije najpritiskniji izazov za budući rad.Abstract
Detta arbete behandlar paradigmuppt채ckingsproblemet (PDP), uppgiften att l채ra sig ett b철jligt morfologiskt system fr책n oannoterade meningar. Vi formaliserar PDP och utvecklar utv채rderingsmetoder f철r bed철mningssystem. Med hj채lp av tillg채ngliga resurser konstruerar vi dataupps채ttningar f철r uppgiften. Vi tar ocks책 fram ett heuristiskt riktm채rke f철r PDP och rapporterar empiriska resultat p책 fem olika spr책k. V책rt benchmarksystem anv채nder sig f철rst av ordinb채ddningar och str채ngliknande till klusterformer per cell och paradigm. Sedan startar vi upp en neural transducer ovanp책 klustrada data f철r att f철ruts채ga ord f철r att f철rverkliga de tomma paradigmplatserna. En felanalys av v책rt system tyder p책 att klustring per cell 철ver olika b철jningsklasser 채r den mest angel채gna utmaningen f철r framtida arbete.Abstract
Kazi hii inatumia tatizo la uvumbuzi (PDP), jukumu la kujifunza mfumo wa kisiasa wa kifolojia kutokana na hukumu zisizoeleweka. Tunaweza kutengeneza chama cha PDP na kuendeleza mbinu za uchunguzi kwa ajili ya mifumo ya kuhukumu. Kwa kutumia rasilimali zinazopatikana hivi sasa, tunajenga seti za data kwa ajili ya kazi. Pia tunaunda bendera ya kisasa kwa chama cha PDP na kuripoti matokeo ya utata katika lugha tano tofauti. Mfumo wetu wa bendera mara ya kwanza unatumia maneno yanayotumika na mfumo unaofanana na kuunganisha viumbe kwa simu na vifaa. Kisha, tunaanzisha mpasuaji wa neura juu ya taarifa zilizotengenezwa ili kutabiri maneno ya kuelewa vifaa vinavyofaa. Uchambuzi wa makosa wa mfumo wetu unapendekeza kuunganishwa na seli katika darasa tofauti za mawasiliano ni changamoto kubwa zaidi kwa kazi za baadaye.Abstract
இந்த வேலை செயல்படுத்தும் அளபுரிய கண்டுபிடிப்பு பிரச்சனையை (PDP), புதிதாக்கப்படாத வாக்கியங்களிலிருந்து கற்றுக்கொ We formalize the PDP and develop evaluation metrics for judging systems. தற்போது கிடைக்கும் வளங்களை பயன்படுத்தி, பணிக்கு தரவு அமைப்புகளை உருவாக்குகிறோம். மேலும் நாம் PDP க்கான ஒரு உயர்ந்த குறிப்பை உருவாக்கி ஐந்து வித்தியாசமான மொழிகளில் முடிவுகளை அறிவிக்க. எங்கள் பென்க்மார்க் அமைப்பு முதலில் வார்த்தை உள்ளடக்கங்கள் மற்றும் சரத்தின் போன்றும் செல்லை மற்றும் அளபுருவா பின்னர், நாம் வெற்று அளபுருக்களை புரிந்து கொள்ள முடியும் தகவல் மேல் ஒரு புதிய மாற்றியை துவங்குகிறோம். எங்கள் கணினியின் பிழை ஆய்வு அறையால் வேறு வகுப்புகளுக்கு முழுவதும் சேர்க்கும் வகுப்புகள் மூலம் சேர்க்கும் பொரAbstract
Bu işe paradigm keşfetme meselesini (PDP) bilen tanınmadyk sözlerinden bir şekilde etkileşimli morfolojik sistemini öwrenmek üçin gözleýär. PDP'i formalizýarys we çözgüt sistemleri üçin deňleme metriklerini geliştirdik. Häzirki ýerleşýän çeşmeleri ullanýar, zadyň üçin veri setirleri inşa edýäris. Biz hem PDP üçin heuristik gabdalyk düzenledik we beş dürli dillerde empirik netijesini bildirip görkezdik. İlk olarak benchmark sistemimiz kelime içerikleri ve ipleri hücre ve paradigm şeklinde benzeri bir şekilde kullanır. Sonra mantar verilerinin üstünde näral terjime etmäge başladyk. Sistemimiziň ýalňyşlyk analizi hücreleriň üýtgeşmeleri farklı täsirler klaslarynda çarpmak gelejekde üçin iň kynçylyk däldir.Abstract
یہ کام پاراڈیگم اچانک مسئلہ (PDP) کو معلوم کرتا ہے، ایک غیر معلوم جماعت سے اچانک مورفیق سیسٹم کی تعلیم کا کام ہے۔ ہم پی پی پی پی کو فرمول کر رہے ہیں اور فیصلہ سیسٹم کے لئے ارزش میٹریک کو اختیار کررہے ہیں۔ اب موجود موجود سروسیلوں کے استعمال میں ہم دنیا کے لئے ڈیٹ سٹ بناتے ہیں. ہم بھی پی پی پی کے لئے ایک ہوریستیک بنچم مارک بناتے ہیں اور پانچ مختلف زبانوں پر امپریستی نتائج گزارتے ہیں۔ ہمارے بنچم مارک سیسٹم پہلی بار کلمات کے مطابق استعمال کرتا ہے اور کلسٹر فرموں کے مطابق سلول اور پارادیگ کے مطابق استعمال کرتا ہے پھر ہم نے کلسٹر ڈیٹا کے اوپر ایک نئورل ٹرندڈوکر کو بوٹ ڈال دیا کہ کلمات کو پیش بینی کریں کہ پاراڈیگ لٹ کو معلوم کریں ہمارے سیسٹم کی خطا تحلیل کی مشورت کرتی ہے کہ سلول کے ذریعہ مختلف تحلیل کلاسوں میں کلسٹر کرنا مستقبل کام کے لئے سب سے زیادہ تحلیل ہے.Abstract
Bu ishni paradigm topish muammolarini boshqaradi (PDP), nomaʼlum so'zlardan fofologik tizimni o'rganish vazifasi. Biz PDP formatlarini formatlash va tizimni bajarish uchun qiymatlash metriklarini tahlil qilamiz. Joriy mavjud manbalar yordamida vazifa uchun maʼlumot set tuzumiz. Biz PDP uchun heuristik benchmark yaratdik va besh xil tillarda muvaffaqiyatli natijalarni xabar qilamiz. Bizning benchmark tizimimizning birinchi so'zlar ichiga kiritiladi va satrlarni katak va paradigm tomonidan foydalanadi. Keyin biz bir necha tarmoqni ishga tushirib qo'yishingiz mumkin. Bu so'zlarni o'rganish uchun boʻsh paradigm slotlarini tasdiqlash mumkin. Tizimdagi xato analyzeri, har xil sinfning boshqa sinfdagi hujayralar bilan birlashtirishni anglatadi. Bu kelajakdagi ish uchun eng qismi muammolari.Abstract
Việc này giải quyết vấn đề khám phá biểu tượng (PDP), nhiệm vụ đào tạo một hệ thống hình học từ từ các câu không ghi chú. Chúng tôi chính thức PDP và phát triển hệ thống đo đánh giá. Sử dụng nguồn tài nguyên hiện có, chúng tôi xây dựng các tập tin cho nhiệm vụ. Chúng tôi cũng đặt ra tiêu chuẩn thần kinh cho PDP và báo cáo kết quả theo năm ngôn ngữ khác nhau. Trước tiên, hệ thống tiêu chuẩn của chúng ta sẽ sử dụng sự nhúng vào từ và giống nhau chuỗi với dạng cụm có theo tế bào và theo mô hình. Sau đó, chúng ta khởi động một máy biến năng thần kinh lên trên các dữ liệu đã giấu để dự đoán từ ngữ để nhận ra các khe hở hàng mẫu rỗng. Một phân tích lỗi trong hệ thống cho thấy tụ tập bởi tế bào qua các lớp biến đổi khác là thử thách quan trọng nhất cho công việc tương lai.Abstract
这项工作处理范式发现问题(PDP),即从未注句子中学习屈折形态系统的任务。我们将PDP形式化,并开发用于判断系统的评估指标。使用当前可用的资源,我们为任务构建数据集。我们还为PDP设计了一个启发式基准,并报告了五种不同语言的实证结果。我们的基准测试系统首先利用单词嵌入和字符串相似性来按单元和范式进行聚类。然后,我们在聚类数据的顶部引导一个神经传感器来预测单词,以实现空的范例槽。对我们系统的错误分析表明,跨不同拐点类别的细胞聚类是未来工作中最紧迫的挑战。- Anthology ID:
- 2020.acl-main.695
- Volume:
- Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics
- Month:
- July
- Year:
- 2020
- Address:
- Online
- Venue:
- ACL
- SIG:
- Publisher:
- Association for Computational Linguistics
- Note:
- Pages:
- 7778–7790
- Language:
- URL:
- https://aclanthology.org/2020.acl-main.695
- DOI:
- 10.18653/v1/2020.acl-main.695
- Bibkey:
- Cite (ACL):
- Alexander Erdmann, Micha Elsner, Shijie Wu, Ryan Cotterell, and Nizar Habash. 2020. The Paradigm Discovery Problem. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 7778–7790, Online. Association for Computational Linguistics.
- Cite (Informal):
- The Paradigm Discovery Problem (Erdmann et al., ACL 2020)
- Copy Citation:
- PDF:
- https://aclanthology.org/2020.acl-main.695.pdf
- Video:
- http://slideslive.com/38928868
- Code
- alexerdmann/ParadigmDiscovery
- Data
- Universal Dependencies
- Terminologies:
Export citation
@inproceedings{erdmann-etal-2020-paradigm, title = "The Paradigm Discovery Problem", author = "Erdmann, Alexander and Elsner, Micha and Wu, Shijie and Cotterell, Ryan and Habash, Nizar", booktitle = "Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics", month = jul, year = "2020", address = "Online", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2020.acl-main.695", doi = "10.18653/v1/2020.acl-main.695", pages = "7778--7790", }
<?xml version="1.0" encoding="UTF-8"?> <modsCollection xmlns="http://www.loc.gov/mods/v3"> <mods ID="erdmann-etal-2020-paradigm"> <titleInfo> <title>The Paradigm Discovery Problem</title> </titleInfo> <name type="personal"> <namePart type="given">Alexander</namePart> <namePart type="family">Erdmann</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Micha</namePart> <namePart type="family">Elsner</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Shijie</namePart> <namePart type="family">Wu</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Ryan</namePart> <namePart type="family">Cotterell</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Nizar</namePart> <namePart type="family">Habash</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <originInfo> <dateIssued>2020-07</dateIssued> </originInfo> <typeOfResource>text</typeOfResource> <relatedItem type="host"> <titleInfo> <title>Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics</title> </titleInfo> <originInfo> <publisher>Association for Computational Linguistics</publisher> <place> <placeTerm type="text">Online</placeTerm> </place> </originInfo> <genre authority="marcgt">conference publication</genre> </relatedItem> <identifier type="citekey">erdmann-etal-2020-paradigm</identifier> <identifier type="doi">10.18653/v1/2020.acl-main.695</identifier> <location> <url>https://aclanthology.org/2020.acl-main.695</url> </location> <part> <date>2020-07</date> <extent unit="page"> <start>7778</start> <end>7790</end> </extent> </part> </mods> </modsCollection>
%0 Conference Proceedings %T The Paradigm Discovery Problem %A Erdmann, Alexander %A Elsner, Micha %A Wu, Shijie %A Cotterell, Ryan %A Habash, Nizar %S Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics %D 2020 %8 July %I Association for Computational Linguistics %C Online %F erdmann-etal-2020-paradigm %R 10.18653/v1/2020.acl-main.695 %U https://aclanthology.org/2020.acl-main.695 %U https://doi.org/10.18653/v1/2020.acl-main.695 %P 7778-7790
Markdown (Informal)
[The Paradigm Discovery Problem](https://aclanthology.org/2020.acl-main.695) (Erdmann et al., ACL 2020)
- The Paradigm Discovery Problem (Erdmann et al., ACL 2020)
ACL
- Alexander Erdmann, Micha Elsner, Shijie Wu, Ryan Cotterell, and Nizar Habash. 2020. The Paradigm Discovery Problem. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 7778–7790, Online. Association for Computational Linguistics.