Adversarial Multitask Learning for Joint Multi-Feature and Multi-Dialect Morphological Modeling Adversariale Multitask Learning for Joint Multi-Feature and Multi-Dialect Morphological Modeling ምርጫዎች التعلم متعدد المهام العدائي للنمذجة المورفولوجية متعددة الميزات واللهجات المشتركة Birleşik çoxlu-füsusiyyət və çoxlu-Dialekt Morfolojik Modelinə öyrənmək Неблагоприятно многофункционално обучение за съвместно многофункционално и многодиалектно морфологично моделиране সংযুক্ত বহুবিশেষ বৈশিষ্ট্য এবং বহুডায়েক্ত মরোফোলজিক্যাল মডেল སྤྲོ་སྣང་གླེང་བོའི་སྣ་མང་བོའི་འགྲོ་སྣང་ཚོགས་དང་མཐུན་སྣ་མང་བོའི་རྣམ་པ། Adversarialno učenje multitask za zajedničku multifunkciju i multidijaletsku morfološku modelu Adversarial Multitask Learning for Joint Multi-Feature and Multi-Dialect Morphological Modeling Adversariální multiúlohové učení pro společné multifunkční a multidialektní morfologické modelování Adversarial Multitask Learning for Joint Multi-Feature og Multi-Dialect Morphological Modeling Adversariales Multitask-Lernen für gemeinsame Multi-Feature- und Multi-Dialekt-Morphologische Modellierung Αντίθετα εκμάθηση πολλαπλών εργασιών για κοινή μορφολογική μοντελοποίηση πολλαπλών χαρακτηριστικών και πολλαπλών διαλεκτικών μορφολογικών μοντέλων Aprendizaje contradictorio multitarea para el modelado morfológico conjunto de múltiples características y multidialectos Kõrvalsaaduslik mitmeülesandeline õpe liigese mitmefunktsionaalseks ja mitmedialektiliseks morfoloogiliseks modelleerimiseks آموزش تعداد چندکارهای مخالف برای مدلهای مورفولاژیک مجموعهای و مجموعههای مجموعهای Adversarial Multitask Learning for Joint Multi-Feature and Multi-Dialect Morfologic Modeling Apprentissage multitâche contradictoire pour la modélisation morphologique conjointe multi-fonctionnalités et multi-dialectes Foghlaim Ilthasc Sáraíochta maidir le Samhaltú Moirfeolaíoch Comhpháirteach Ilghnéitheach agus Ilchanúintí KCharselect unicode block name למידה רבה משימות נוגדית למדליגה מורפולוגית רבה-תכונות ומרבה-דיאלקט משותפת संयुक्त मल्टी-फीचर और मल्टी-बोली रूपात्मक मॉडलिंग के लिए प्रतिकूल मल्टीटास्क लर्निंग Adversarial Multitask Learning for Joint Multi-Feature and Multi-Dialect Morphological Modeling Adversariális többfeladatú tanulás közös többfunkciós és többtárcsás morfológiai modellezéshez Adversarial Multitask Learning for Joint Multi-Feature and Multi-Dialect Morphological Modeling Pelajaran Multitask Adversarial for Joint Multi-Feature and Multi-Dialect Morphological Modeling Apprendimento Multitask Adversariale per la modellazione Morfologica Multifunzione e MultiDialettica Congiunta 多機能と多方言の形態モデリングのための対抗的なマルチタスク学習 Advertorial Multitask Learning for Joint Multi-Attribution and Multi-diaselect მრავალური მრავალური მოდიალოგიური მოდელეგიური მოდელეგიური მრავალური მონაცემებისთვის Көп қасиеттерді және көп диалективті морфологикалық үлгілеу үшін көптеген көптеген тапсырмаларды оқыту 다특징 다방언 형태 모델링을 결합한 대항식 다임무 학습 Nepageidaujamas daugiafunkcinis mokymasis bendram daugiafunkciniam ir daugiafunkciniam morfologiniam modeliavimui Adversarial Multitask Learning for Joint Multi-Feature and Multi-Dialect Morphological Modeling യൂണ്ട് Multi- Feature, Multi- Dialect Morphological Modeling Олон-функц болон олон-диалог морфологик загварын төлөөлөгч олон ажил суралцах Pembelajaran Multitugas Berlawan untuk Modelan Morfologik Bersama-berbilang-Feature dan Multi-Dialeksi Tagħlim Multikompitu Adversarju għal Mudellar Morfoloġiku Konġunt b’Karatteristiċi Multi-u Multi-Dijaletti Tegenstrijdig Multitask Leren voor Gezamenlijke Multi-Feature en Multi-Dialect Morphologische Modeling Rekursarialt multioppgåve-læring for fleire funksjonar og fleire-dialekt morfologisk modellering Wielozadaniowe uczenie się wielozadaniowe dla wspólnego modelowania morfologicznego wielofunkcyjnego i wielozadaniowego Aprendizagem multitarefa adversária para modelagem morfológica conjunta de vários recursos e multidialetos Învățare adversară multifuncțională pentru modelarea Morfologică Multifuncțională și MultiDialectă Comună Соперническое многозадачное обучение для совместного многофункционального и мультидиалектного морфологического моделирования සම්බන්ධ විශේෂතාවක් සහ ගොඩක් විශේෂතාවක් සඳහා ගොඩක් විශේෂතාවක් ඉගෙනගන්න Neželeno večopravilno učenje za skupno večfunkcijsko in večdialektno morfološko modeliranje Barista shaqo badan ee Joint Multi-Feature and Multi-Dialect Morphological Modeling Mësimi kundërshtar i shumëdetyrave për modelimin e përbashkët morfologjik multifunksional dhe multidialektor Adversarialno multitask učenje za zajedničku multifunkciju i multidijaletsku morfološku modelu Adversarial Multitask Learning för gemensam multi-funktion och multi-dialekt morfologisk modellering Kufundisha Jumuiya ya Zaidi kwa ajili ya Tamko Multi-Tafadhali na Utawala wa Kidemolojia இணைப்பு பல- தன்மை Birnäçe-möhüm we Birnäçe-Dialekat Morpholojik nusgasy üçin öwrenmek متعدد Multi-Feature اور Multi-Dialect Morphological Modeling کے لئے مخالف Multitask سیکھنا Name Truyền thuyết nhiều đặc trưng tổng hợp và đa thoại văn học 以合多方言形建模者对抗性多任务学
Abstract
Morphological tagging is challenging for morphologically rich languages due to the large target space and the need for more training data to minimize model sparsity. Dialectal variants of morphologically rich languages suffer more as they tend to be more noisy and have less resources. In this paper we explore the use of multitask learning and adversarial training to address morphological richness and dialectal variations in the context of full morphological tagging. We use multitask learning for joint morphological modeling for the features within two dialects, and as a knowledge-transfer scheme for cross-dialectal modeling. We use adversarial training to learn dialect invariant features that can help the knowledge-transfer scheme from the high to low-resource variants. We work with two dialectal variants : Modern Standard Arabic (high-resource dialect’) and Egyptian Arabic (low-resource dialect) as a case study. Our models achieve state-of-the-art results for both. Furthermore, adversarial training provides more significant improvement when using smaller training datasets in particular.Abstract
Morfologiese etiketting is aanvaardig vir morfologiese ryk tale vanweë die groot doel spasie en die nodig vir meer onderwerking data om model sparsiteit te minimiseer. Dialekteel variante van morfologiese ryk tale lyk meer as hulle tendeer meer geluid wees en het minder hulpbronne. In hierdie papier ondersoek ons die gebruik van multitaak leer en teenstandaar onderwerp om morfologiese rykdom en dialektiese veranderinge in die konteks van volle morfologiese merking te adres. Ons gebruik multitaak leer vir joint morfologiese modellering vir die funksies binne twee dialekte, en as 'n kennis-oordragskema vir kruis-dialektiese modellering. Ons gebruik teenwoordige onderwerp om dialekte ongeldige funksies te leer wat die kennis-oordrag skema kan help van die hoë na lae hulpbron variante. Ons werk met twee dialekte variante: Moderne Standaard Arabs (hoë- hulpbron 'dialekte') en Egipte Arabiese (lae- hulpbron dialekte) as 'n Kas studie. Ons modele bereik staat-van-kuns resultate vir beide. Ook, teenstandaarlike onderwerking verskaf meer beter verbetering wanneer kleiner onderwerking datastelle spesifieke gebruik word.Abstract
ሞሮፎሎጂ ማተሚያ በተለየ ትልቁ ስፋት ምክንያት የሀብታም ቋንቋዎች እና የሞዴል ስፋት ለማንቀሳቀስ የሚያስፈልገውን ዳታ የሚያስፈልግ ነው፡፡ የዳሌካዊ ቋንቋዎች የሞርፎሎጂ ባለ ጠጎች ቋንቋዎች እየተጨነቁ ድምፅ እና የተነሳ ሀብት እንዳላቸው ይጨነቃሉ፡፡ በዚህ ፕሮግራም በሙሉ ሞሮፎሎጂ ማቀናጃ ውስጥ የሞፎሎጂ ሀብት እና የዲያሌክቲካዊ ልውጤቶችን ለመጠቀም እና በተቃዋሚ ትምህርት ላይ የሚጠይቅ እናደርጋለን፡፡ We use multitask learning for joint morphological modeling for the features within two dialects, and as a knowledge-transfer scheme for cross-dialectal modeling. እውቀትን-ለውጥ ፕሮግራሙን ከረጅም ጀምሮ እስከ ታናሹ ምናልባት ለመማር የሚችሉትን ተቃዋሚ ትምህርት እናጠይቃለን፡፡ በሁለት ዳሌካዊ መለያየት እንሠራለን፤ የአሁኑ የአርቢኛ ስርዓት (ከፍተኛ resource 'dialect') እና የግብፃዊ አረብኛ (low resource dialect) እንደ case ትምህርት ነው። ምሳሌዎቻችን ለሁለቱ የዓርብ ፍሬዎችን አግኝተዋል፡፡ በተጨማሪም የተቃዋሚ ትምህርት በተለየ ትንሽ ትምህርት ዳታዎችን በተጠቀም ጊዜ የሚጨምረው ትልቅ ማድረግ ይሰጣል።Abstract
يمثل وضع العلامات المورفولوجية تحديًا للغات الغنية شكليًا نظرًا للمساحة الكبيرة المستهدفة والحاجة إلى مزيد من بيانات التدريب لتقليل تباين النموذج. تعاني المتغيرات اللهجة للغات الغنية شكليًا أكثر لأنها تميل إلى أن تكون أكثر صخبًا ولديها موارد أقل. في هذه الورقة ، نستكشف استخدام التعلم متعدد المهام والتدريب على الخصومة لمعالجة الثراء المورفولوجي والاختلافات اللهجة في سياق العلامات المورفولوجية الكاملة. نحن نستخدم التعلم متعدد المهام للنمذجة المورفولوجية المشتركة للميزات داخل لهجتين ، وكمخطط لنقل المعرفة للنمذجة عبر اللهجات. نحن نستخدم التدريب العدائي لتعلم ميزات اللهجة الثابتة التي يمكن أن تساعد مخطط نقل المعرفة من المتغيرات ذات الموارد العالية إلى المتغيرات منخفضة الموارد. نحن نعمل مع نوعين من اللهجات: اللغة العربية الفصحى الحديثة (لهجة عالية الموارد) والعربية المصرية (لهجة منخفضة الموارد) كدراسة حالة. تحقق نماذجنا نتائج متطورة لكليهما. علاوة على ذلك ، يوفر التدريب العدائي تحسينًا أكثر أهمية عند استخدام مجموعات بيانات تدريب أصغر على وجه الخصوص.Abstract
Morfolojik etiketi böyük məqsəd alanına görə morfolojik zengin dillər üçün çətinlikdir və modellərin küçük olması üçün daha çox təhsil məlumatlarının ehtiyacı. Morfolojik zəngin dillərin Dialektik dəyişiklikləri daha səslü və daha az qüvvət sahibi olduğu kimi daha çox səslənir. Bu kağıtda çoxlu işin öyrənməsini və düşmənçilik təhsil etməsini çoxlu işin istifadəsini keşfetirik ki, morfolojik baxışlığı və dialektal dəyişiklikləri tamamlayıb morfolojik etiketlərinin məsələsində çəkilərlər. Biz çoxlu işin öyrənməsini birlikdə morfolojik modellik üçün iki dialekt içindəki özelliklər üçün və çoxlu dialektal modellik üçün elm-transfer taslağı üçün istifadə edirik. Biz düşmənçi təhsil işlədirik dialekti istifadə edirik ki, bilim-transfer taslağına yüksək ressurs variablarına kömək edə bilər. Biz iki dialektal dəyişikliyi ilə çalışırıq: Modern Standard Arabic (high-resource 'dialect') və Mısır Arapças ı (low-resource dialect) məlumatları məlumatları olaraq. Bizim modellərimiz hər ikisinin şəkildə mövcuddur. Daha sonra, düşmənçilik təhsil kiçik təhsil verilənlər istifadə edərkən daha böyük təhsil edər.Abstract
Морфологичното етикетиране е предизвикателство за морфологично богати езици поради голямото целево пространство и необходимостта от повече данни за обучение, за да се сведе до минимум оскъдността на модела. Диалектичните варианти на морфологично богатите езици страдат повече, тъй като са склонни да бъдат по-шумни и имат по-малко ресурси. В настоящата статия изследваме използването на многозадачно обучение и съперническо обучение за справяне с морфологичното богатство и диалекталните вариации в контекста на пълното морфологично маркиране. Използваме многозадачно обучение за съвместно морфологично моделиране на характеристиките в рамките на два диалекта и като схема за трансфер на знания за междудиалектално моделиране. Използваме съперническо обучение, за да научим диалектни инвариращи функции, които могат да помогнат на схемата за трансфер на знания от вариантите с висок към нисък ресурс. Работим с два диалектни варианта: модерен стандартен арабски (високоресурсен "диалект") и египетски арабски (нискоресурсен диалект) като казус. Нашите модели постигат най-съвременни резултати и за двете. Освен това състезателното обучение осигурява по-значително подобрение, когато се използват по-малки набори от данни за обучение.Abstract
মোর্ফোলজিক্যাল ট্যাগিং বিশাল লক্ষ্যের স্থানের কারণে মরোফোলিকাল ভাষার জন্য সমৃদ্ধ ভাষার চ্যালেঞ্জ করছে এবং মডেলের স্পা মরোফোলজিক ভাষার ডায়ালগেক্টাল ভিন্ন ভিন্ন ভিন্ন ভিন্ন ভিন্ন যেহেতু তারা আরো বেশী আওয়াজ এবং কম সম্পদ রয়েছে। In this paper we explore the use of multitask learning and adversarial training to address morphological richness and dialectal variations in the context of full morphological tagging. We use multitask learning for joint morphological modeling for the features within two dialects, and as a knowledge-transfer scheme for cross-dialectal modeling. আমরা বিরোধী প্রশিক্ষণ ব্যবহার করি যাতে বিরোধী বিশেষ বৈশিষ্ট্য শিখতে পারি যা উচ্চ থেকে কম সম্পদ পর্যন্ত জ্ঞান-পরিবর্তনের পরিকল্পনা স আমরা দুই ডায়ালেক্টাল ভিন্ন ভিন্ন ভিন্ন ভিন্নের সাথে কাজ করি: আধুনিক স্ট্যান্ডার্ড আরবী (উচ্চ মূল্য 'ডায়ালেক্টর') এবং মিশরীয় আর আমাদের মডেল দুজনের জন্য রাষ্ট্রের শিল্পের ফলাফল অর্জন করে। এছাড়াও, বিরোধী প্রশিক্ষণ বিশেষ করে ছোট ট্রেনিং ডাটাসেট ব্যবহার করার সময় বেশী গুরুত্বপূর্ণ উন্নতি দেয়।Abstract
Morphological tagging is challenging for morphologically rich languages due to the large target space and the need for more training data to minimize model sparsity. དབྱེ་རིག་གི་སྐད་ཡིག In this paper we explore the use of multitask learning and adversarial training to address morphological richness and dialectal variations in the context of full morphological tagging. We use multitask learning for joint morphological modeling for the features within two dialects, and as a knowledge-transfer scheme for cross-dialectal modeling. ང་ཚོས་ཤེས་བྱེད་པའི་གྲ་སྒྲིག་ཐད་ནས་dialect་ནང་ཁག We work with two dialectal variants: Modern Standard Arabic (high-resource 'dialect') and Egyptian Arabic (low-resource dialect) as a case study. ང་ཚོའི་མིག་དབྱིབས་འཆར་བཀོད་པའི་གནས་སྟངས་དང་མཉམ་དུ་རྩལ་བ་ཡོད་པ་རེད། ད་དུང་། གནད་དོན་གྱི་གྲ་སྒྲིག་ཐད་ནས་སྨན་པར་གཞི་རྩལ་ཆུང་ཉུང་བའི་གྲ་སྒྲིགAbstract
Morfološki etiketiranje je izazovno za morfološki bogate jezike zbog velikog ciljnog prostora i potrebe za većim podacima obuke za minimizaciju modela sparsiteta. Dialektične variante morfološki bogatih jezika pati više jer su navikli da budu buksniji i imaju manje resursa. U ovom papiru istražujemo korištenje multitask učenja i adversarnog treninga za rješavanje morfološkog bogatstva i dijalektnih varijacija u kontekstu punog morfološkog značkanja. Koristimo učenje multitask a za zajedničku morfološku modeliranje za karakteristike unutar dva dijalekta, i kao šemu prijenosa znanja za transdijalektnu modeliranje. Koristimo neprijateljsku obuku da naučimo invariantne karakteristike dijalekta koji mogu pomoći šemu prenošenja znanja iz visokih na niskih resursa. Radimo sa dvije dijalektne variante: moderni standardni arapski (visoki resursi 'dijalekt') i egipatski arapski (niski dijalekt resursa) kao studija slučajeva. Naši modeli postignu rezultate umjetnosti za oboje. Nadalje, neprijateljska obuka pruža značajnije poboljšanje kada koristi manje podatke o obuci posebno.Abstract
L'etiquetage morfològic és un repte per les llengües rics morfològicament degut a l'espai d'objectiu gran i la necessitat de més dades d'entrenament per minimitzar l'escassetat del model. Les variants dialectals de llengües rics morfològicament pateixen més mentre tendeixen a ser més sorolloses i tenen menys recursos. En aquest paper explorem l'ús de l'aprenentatge multitasca i l'entrenament adversari per abordar la riquesa morfològica i les variacions dialectals en el context de l'etiquetage morfològic complet. Utilitzem l'aprenentatge multitasca per a modelar morfològicament conjunt les característiques de dos dialectes, i com un esquema de transfer ència de coneixements per a modelar dialectalment. Utilitzem entrenament adversari per aprendre característiques dialectuals invariants que poden ajudar l'esquema de transfer ència de coneixements de les variants d'alta a baixa quantitat de recursos. Traballem amb dues variants dialectals: l'àrab Estàndard Modern (dialecte d'alt recurso) i l'àrab Egiptià (dialecte de baix recurso) com a estudi de cas. Els nostres models aconsegueixen resultats més avançats per ambdós. A més, la formació adversaria proporciona millors més significatius quan utilitzen petits conjunts de dades de formació en particular.Abstract
Morfologické tagování je pro morfologicky bohaté jazyky náročné kvůli velkému cílovému prostoru a potřebě více tréninkových dat k minimalizaci řídkosti modelu. Dialektní varianty morfologicky bohatých jazyků trpí více, protože mají tendenci být hlučnější a mají méně zdrojů. V tomto článku zkoumáme využití multitasking learningu a adversariálního tréninku k řešení morfologického bohatství a dialektálních variací v kontextu plného morfologického tagování. Využíváme multitasking learning pro společné morfologické modelování rysů ve dvou dialektech a jako schéma přenosu znalostí pro cross-dialektální modelování. Používáme adversariální trénink k učení se dialektově invariantních vlastností, které mohou pomoci schématu přenosu znalostí z variant vysokých k variantám s nízkými zdroji. Pracujeme se dvěma dialektálními variantami: moderní standardní arabštinou (high-resource 'dialect') a egyptskou arabštinou (low-resource dialect) jako případovou studií. Naše modely dosahují nejmodernějších výsledků pro obojí. Navíc při používání menších souborů dat výcviku přináší výraznější zlepšení.Abstract
Morfologisk mærkning er udfordrende for morfologisk rige sprog på grund af det store målrum og behovet for flere træningsdata for at minimere modellens sparthed. Dialektiske varianter af morfologisk rige sprog lider mere, da de har tendens til at være mere støjende og har mindre ressourcer. I denne artikel undersøger vi brugen af multitask læring og adversarial træning til at adressere morfologisk rigdom og dialektiske variationer i sammenhæng med fuld morfologisk tagging. Vi bruger multitask læring til fælles morfologisk modellering for træk inden for to dialekter, og som vidensoverførsel skema til tværdidialektal modellering. Vi bruger adversial træning til at lære dialekt invariant funktioner, der kan hjælpe vidensoverførselsordningen fra høj til lav ressource varianter. Vi arbejder med to dialektiske varianter: Modern Standard Arabic (high-resource 'dialect') og egyptisk Arabic (low-resource dialect) som et casestudie. Vores modeller opnår topmoderne resultater for begge dele. Endvidere giver modstandsuddannelse en større forbedring, især ved anvendelse af mindre træningsdatasæt.Abstract
Morphologische Tagging ist eine Herausforderung für morphologisch reiche Sprachen aufgrund des großen Zielraums und des Bedarfs an mehr Trainingsdaten, um die Modellsparsität zu minimieren. Dialektale Varianten morphologisch reicher Sprachen leiden stärker, da sie eher lauter sind und weniger Ressourcen haben. In diesem Beitrag untersuchen wir die Verwendung von Multitask-Lernen und adversarialem Training, um morphologischen Reichtum und dialektalen Variationen im Kontext der vollständigen morphologischen Tagging zu adressieren. Wir verwenden Multitask Learning zur gemeinsamen morphologischen Modellierung der Merkmale innerhalb zweier Dialekte und als Wissenstransfer-Schema für die dialektale Modellierung. Wir verwenden adversariales Training, um dialektinvariante Eigenschaften zu erlernen, die den Wissenstransfer von den hoch- zu ressourcenarmen Varianten unterstützen können. Wir arbeiten mit zwei dialektalen Varianten: Modernes Standardarabisch (High Resource 'Dialekt') und Ägyptisches Arabisch (Low Resource Dialekt) als Fallstudie. Unsere Modelle erzielen bei beiden den neuesten Stand der Technik. Darüber hinaus bietet das adversariale Training insbesondere bei der Nutzung kleinerer Trainingsdatensätze deutlichere Verbesserungen.Abstract
Η μορφολογική σήμανση αποτελεί πρόκληση για τις μορφολογικά πλούσιες γλώσσες λόγω του μεγάλου χώρου στόχου και της ανάγκης για περισσότερα δεδομένα κατάρτισης για να ελαχιστοποιηθεί η έλλειψη μοντέλου. Οι διαλεκτικές παραλλαγές των μορφολογικά πλούσιων γλωσσών υποφέρουν περισσότερο καθώς τείνουν να είναι πιο θορυβώδεις και να έχουν λιγότερους πόρους. Στην παρούσα εργασία διερευνούμε τη χρήση της εκμάθησης πολλαπλών εργασιών και της αντιπροσωπικής εκπαίδευσης για την αντιμετώπιση του μορφολογικού πλούτου και των διαλεκτικών παραλλαγών στο πλαίσιο της πλήρους μορφολογικής σήμανσης. Χρησιμοποιούμε την εκμάθηση πολλαπλών εργασιών για κοινή μορφολογική μοντελοποίηση των χαρακτηριστικών μέσα σε δύο διαλέκτους, και ως ένα σχέδιο μεταφοράς γνώσης για διασταυρούμενη μοντελοποίηση. Χρησιμοποιούμε την αντιπροσωπική εκπαίδευση για να μάθουμε αναλλοίωτα χαρακτηριστικά διαλέκτων που μπορούν να βοηθήσουν το σχέδιο μεταφοράς γνώσης από τις παραλλαγές υψηλών σε χαμηλών πόρων. Δουλεύουμε με δύο διαλεκτικές παραλλαγές: τα σύγχρονα τυποποιημένα αραβικά (διάλεκτος υψηλής περιεκτικότητας) και τα αιγυπτιακά αραβικά (διάλεκτος χαμηλής περιεκτικότητας) ως μια μελέτη περίπτωσης. Τα μοντέλα μας επιτυγχάνουν αποτελέσματα τελευταίας τεχνολογίας και για τα δύο. Επιπλέον, η αντικρουστική εκπαίδευση παρέχει πιο σημαντική βελτίωση ιδίως όταν χρησιμοποιείται μικρότερα σύνολα δεδομένων κατάρτισης.Abstract
El etiquetado morfológico es un desafío para los lenguajes ricos morfológicamente debido al gran espacio objetivo y a la necesidad de más datos de entrenamiento para minimizar la dispersión del modelo. Las variantes dialectales de las lenguas ricas morfológicamente sufren más, ya que tienden a ser más ruidosas y tienen menos recursos. En este artículo exploramos el uso del aprendizaje multitarea y el entrenamiento contradictorio para abordar la riqueza morfológica y las variaciones dialectales en el contexto del etiquetado morfológico completo. Utilizamos el aprendizaje multitarea para el modelado morfológico conjunto de las características dentro de dos dialectos, y como un esquema de transferencia de conocimientos para el modelado entre dialectales. Utilizamos el entrenamiento contradictorio para aprender las características invariantes del dialecto que pueden ayudar al esquema de transferencia de conocimiento de las variantes de recursos altos a los de bajo recurso. Trabajamos con dos variantes dialectales: el árabe estándar moderno («dialecto» de recursos altos) y el árabe egipcio (dialecto de bajos recursos) como estudio de caso. Nuestros modelos logran resultados de vanguardia para ambos. Además, el entrenamiento contradictorio proporciona una mejora más significativa cuando se utilizan conjuntos de datos de entrenamiento más pequeños en particular.Abstract
Morfoloogiline märgistamine on morfoloogiliselt rikkalike keelte jaoks keeruline suure sihtruumi ja vajaduse tõttu rohkem treeninguandmeid mudeli hõreduse minimeerimiseks. Morfoloogiliselt rikkalike keelte dialektilised variandid kannatavad rohkem, kuna need kipuvad olema mürakamad ja vähem ressursse. Käesolevas töös uurime mitmeülesandelise õppe ja vastandliku koolituse kasutamist morfoloogilise rikkuse ja dialektiliste variatsioonide käsitlemiseks täieliku morfoloogilise märgistuse kontekstis. Kasutame mitmeülesandelist õppimist kahe dialekti omaduste ühiseks morfoloogiliseks modelleerimiseks ja dialektidevahelise modelleerimise teadmiste ülekande skeemiks. Me kasutame vastandlikku koolitust, et õppida dialekti invariantide funktsioone, mis võivad aidata teadmiste ülekandmise skeemil kõrge ressursiga variantidest madala ressursiga variantideni. Töötame juhtumiuuringuna kahe dialektilise variandiga: kaasaegne standard araabia (kõrge ressursiga "dialekt") ja Egiptuse araabia (madala ressursiga dialekt). Meie mudelid saavutavad mõlema puhul tipptasemel tulemusi. Lisaks pakub vastastikune koolitus olulisemat paranemist eelkõige väiksemate koolitusandmete kasutamisel.Abstract
نقاشی مورفولوژیکی برای زبانهای پولدار مورفولوژیکی به دلیل فضای بزرگ هدف و نیازی برای اطلاعات آموزش بیشتری برای کمینه کردن نقاشی مدل است. تغییرات الکتریکی از زبانهای مورفولوژیکی پولدار بیشتری رنج میدهند، در حالی که به نظر میرسند صدای بیشتری باشند و منابع کمتری دارند. در این کاغذ ما استفاده از آموزش تعلیم چندین کار و آموزش مخالفی برای حل ثروت مورفولوژیکی و تغییرات دیالکتی در محیط یادگیری کامل مورفولوژیکی را تحقیق می کنیم. ما از یادگیری بسیاری از کارها برای مدلسازی مورفولوژیکی با هم استفاده میکنیم برای ویژههای دو دیالکت، و به عنوان برنامهی انتقال علمی برای مدلسازی متصل دیالکت. ما از آموزش دشمنی استفاده می کنیم تا ویژه های بینیاز دیالکت یاد بگیریم که میتوانند برنامههای تغییر علم از متغییرات بالا به منابع کم کمک کنند. ما با دو متفاوت دیالکتی کار می کنیم: استاندارد عربی (منابع بالا) و عربی مصری (دیالکت کم منابع) به عنوان یک مطالعه. مدلهای ما نتیجههای وضعیت هنری را برای هر دو میرسانند. علاوه بر این، آموزش دشمنی در زمان استفاده از مجموعههای دادههای کوچک آموزش بیشتری را بهتر میکند.Abstract
Morfologinen tagging on haastavaa morfologisesti rikkaille kielille suuren kohdetilan ja suuremman harjoitusdatan vuoksi mallin niukkuuden minimoimiseksi. Morfologisesti rikkaiden kielten dialektiiviset variantit kärsivät enemmän, koska ne ovat yleensä meluisampia ja niillä on vähemmän resursseja. Tässä työssä tutkitaan monitehtävän oppimisen ja vastakkainasettelun käyttöä morfologisen rikkauden ja dialektisten variaatioiden käsittelemiseksi täydellisen morfologisen taggingin kontekstissa. Käytämme monitehtäväoppimista kahden murteen ominaisuuksien yhteiseen morfologiseen mallintamiseen ja tiedonsiirtosuunnitelmana murteiden väliseen mallintamiseen. Käytämme vastakkainasettelukoulutusta oppiaksemme murteiden invarianttisia ominaisuuksia, jotka voivat auttaa tiedonsiirtoa korkean resurssin muunnelmista vähävaraisiin. Työskentelemme tapaustutkimuksena kahden murteen kanssa: Modern Standard Arabic (high resource 'murre') ja Egyptin Arabic (low resource murre). Mallimme saavuttavat huipputason tulokset molemmille. Lisäksi vastustajakoulutus parantaa merkittävästi erityisesti pienempiä koulutustietoja käytettäessä.Abstract
Le marquage morphologique est difficile pour les langages morphologiquement riches en raison de l'espace cible important et de la nécessité de disposer de plus de données d'apprentissage afin de minimiser la dispersion des modèles. Les variantes dialectales des langues morphologiquement riches souffrent davantage car elles ont tendance à être plus bruyantes et ont moins de ressources. Dans cet article, nous explorons l'utilisation de l'apprentissage multitâche et de l'entraînement contradictoire pour aborder la richesse morphologique et les variations dialectales dans le contexte du marquage morphologique complet. Nous utilisons l'apprentissage multitâche pour la modélisation morphologique conjointe des entités au sein de deux dialectes, et comme schéma de transfert de connaissances pour la modélisation interdialectale. Nous utilisons la formation contradictoire pour apprendre les caractéristiques invariantes du dialecte qui peuvent aider le schéma de transfert de connaissances des variantes à ressources élevées vers les variantes à faibles ressources. Nous travaillons avec deux variantes dialectales : l'arabe standard moderne (« dialecte » à ressources élevées) et l'arabe égyptien (dialecte à faible ressource) en tant qu'étude de cas. Nos modèles permettent d'obtenir des résultats de pointe pour les deux. En outre, l'entraînement contradictoire apporte une amélioration plus significative lors de l'utilisation de plus petits ensembles de données d'entraînement, en particulier.Abstract
Tá an chlibeáil mhoirfeolaíoch dúshlánach do theangacha atá saibhir ó thaobh moirfeolaíochta de mar gheall ar an spás sprice mór agus an gá atá le tuilleadh sonraí oiliúna chun ganntanas samhlacha a íoslaghdú. Fulaingíonn leaganacha canúinteacha de theangacha saibhre moirfeolaíocha níos mó mar go mbíonn claonadh acu a bheith níos torannaí agus níos lú acmhainní acu. Sa pháipéar seo déanaimid iniúchadh ar úsáid na foghlama iltasc agus oiliúint sháraíochta chun aghaidh a thabhairt ar shaibhreas moirfeolaíoch agus éagsúlachtaí canúintí i gcomhthéacs na clibeála moirfeolaíocha iomlána. Bainimid úsáid as foghlaim iltasc le haghaidh comhshamhlú moirfeolaíoch do na gnéithe laistigh de dhá chanúint, agus mar scéim aistrithe eolais do shamhaltú traschanúinteach. Bainimid úsáid as oiliúint sháraíochta chun gnéithe athraitheacha canúintí a fhoghlaim a chabhróidh leis an scéim aistrithe eolais ó na leaganacha ard-acmhainne go dtí na leaganacha acmhainní ísle. Oibrímid le dhá leagan canúinteacha: Araibis Chaighdeánach Nua-Aimseartha ("canúint" ard-acmhainne") agus Araibis Éigipteach (canúint íseal-acmhainne) mar chás-staidéar. Baineann ár múnlaí torthaí den scoth amach don dá cheann. Ina theannta sin, cuireann oiliúint sháraíochta feabhas níos suntasaí ar fáil nuair a úsáidtear tacair shonraí oiliúna níos lú go háirithe.Abstract
KCharselect unicode block name Haƙĩƙa masu variant na harshen morfologically tajiri sun yi cũtarwa da yawa kamar sun zaci sauti da kuma suna da manyan dũkiya kaɗan. Ga wannan takardan, za mu yi amfani da amfani da yin karanta multitaski da wa'adin motsi dõmin su address variabler mutfologi da diƙaitacce idan an cika tagogi na mutfologi. Tuna amfani da karantar multi-aski wa masu motsi da ke haɗuwa na morfologi wa masu tsari wa masu cikin zaƙatan biyu, da kuma kamar wata shirin shifo-transfer wa masanin-motsi. Tuna amfani da mafarin motsi dõmin Mu sanar da bayani ga masu buƙata masu shiga, da za'a iya taimako da shirin-transfer na zane daga masu sarki zuwa manyan-resource. Tuna aiki da variants biyu: Misalinmu suna samun matsayin-sanar dukansu. Furan haka, Trainin da ke motsi yana ƙaranci mafiya kyau idan an yi amfani da danahan masu ƙaranci da amfani da haske.Abstract
תווים מורפולוגיים מאתגרים לשפות עשירות מורפולוגית בגלל מרחב המטרה הגדול והצורך ליותר נתונים אימונים כדי להפחית את הידרדרות המודל. שינויים דיאלקטיים של שפות עשירות מורפולוגית סובלים יותר כיוון שהם נוטים להיות רעשים יותר ויש להם פחות משאבים. In this paper we explore the use of multitask learning and adversarial training to address morphological richness and dialectal variations in the context of full morphological tagging. אנו משתמשים בלמדת משימות רבות לדוגמא מורפולוגית משותפת לתחומים בתוך שני דיאלקטים, וכתכנית העברת ידע לדוגמא דרך דיאלקטל. We use adversarial training to learn dialect invariant features that can help the knowledge-transfer scheme from the high to low-resource variants. אנחנו עובדים עם שני שונים דיאלקטאליים: ערבית סטנדרטית מודרנית (דיאלקט עם משאבים גבוהים) ו ערבית מצרית (דיאלקט עם משאבים נמוכים) בתור מחקר מקרים. Our models achieve state-of-the-art results for both. בנוסף, האימונים היריבים מספקים שיפור משמעותי יותר כשמשתמשים במיוחד בקבוצות מידע אימונים קטנות יותר.Abstract
बड़े लक्ष्य स्थान और मॉडल स्पार्सिटी को कम करने के लिए अधिक प्रशिक्षण डेटा की आवश्यकता के कारण रूपात्मक रूप से समृद्ध भाषाओं के लिए रूपात्मक टैगिंग चुनौतीपूर्ण है। रूपात्मक रूप से समृद्ध भाषाओं के बोलचाल के रूपों को अधिक नुकसान होता है क्योंकि वे अधिक शोर करते हैं और कम संसाधन होते हैं। इस पेपर में हम पूर्ण रूपात्मक टैगिंग के संदर्भ में रूपात्मक समृद्धि और बोली संबंधी विविधताओं को संबोधित करने के लिए मल्टीटास्क सीखने और प्रतिकूल प्रशिक्षण के उपयोग का पता लगाते हैं। हम दो बोलियों के भीतर सुविधाओं के लिए संयुक्त रूपात्मक मॉडलिंग के लिए मल्टीटास्क सीखने का उपयोग करते हैं, और क्रॉस-बोलचाल मॉडलिंग के लिए ज्ञान-हस्तांतरण योजना के रूप में। हम बोली अपरिवर्तनीय विशेषताओं को सीखने के लिए प्रतिकूल प्रशिक्षण का उपयोग करते हैं जो उच्च से कम-संसाधन वेरिएंट तक ज्ञान-हस्तांतरण योजना में मदद कर सकते हैं। हम दो बोलचाल के रूपों के साथ काम करते हैं: आधुनिक मानक अरबी (उच्च संसाधन "बोली") और मिस्र की अरबी (कम संसाधन बोली) एक मामले के अध्ययन के रूप में। हमारे मॉडल दोनों के लिए अत्याधुनिक परिणाम प्राप्त करते हैं। इसके अलावा, विशेष रूप से छोटे प्रशिक्षण डेटासेट का उपयोग करते समय प्रतिकूल प्रशिक्षण अधिक महत्वपूर्ण सुधार प्रदान करता है।Abstract
Morfološki označavanje je izazovno za morfološki bogate jezike zbog velikog ciljnog prostora i potrebe za većim podacima obuke za minimizaciju modela sparsitnosti. Dialektične variante morfološki bogatih jezika pati više jer su navikli da budu buksniji i imaju manje resursa. U ovom papiru istražujemo korištenje multizadatačnog učenja i adversarnog treninga za rješavanje morfološkog bogatstva i dijalektnih razlika u kontekstu punog morfološkog značkanja. Koristimo učenje multizadataka za zajedničku morfološku modelizaciju za karakteristike unutar dva dijalekta i kao šemu prijenosa znanja za transdijalektnu modelizaciju. Koristimo neprijateljsku obuku kako bi naučili invariantne karakteristike dijalekata koji mogu pomoći režimu prenošenja znanja iz visokih na niskih resursa. Radimo s dvije dijalektne variante: moderni standardni arapski (visoki resursi 'dijalekt') i egipatski arapski (niski dijalekt resursa) kao studija slučajeva. Naši modeli postignu rezultate umjetnosti za oboje. Nadalje, neprijateljska obuka pruža značajnije poboljšanje kada koristi manje podatke o obuci posebno.Abstract
A morfológiai címkézés kihívást jelent a morfológiailag gazdag nyelvek számára, mivel a nagy célterület és több edzési adat szükséges a modell ritkaságának minimalizálása érdekében. A morfológiailag gazdag nyelvek dialektikus változatai jobban szenvednek, mivel általában zajosabbak és kevesebb erőforrással rendelkeznek. Jelen tanulmányban feltárjuk a multifunkcionális tanulás és az ellentétes képzés használatát a morfológiai gazdagság és dialektuális variációk kezelésére a teljes morfológiai címkézés kontextusában. Multifeladatos tanulást használunk a közös morfológiai modellezéshez két dialektus tulajdonságaihoz, valamint a keresztdialektális modellezéshez szükséges tudástranszfer sémához. Ellenséges képzést használunk a dialektus invariáns tulajdonságok elsajátítására, amelyek segíthetik a tudásátadási rendszert a magas erőforrású változatoktól az alacsony erőforrású változatokig. Esettanulmányként két dialektális változattal dolgozunk: modern standard arab (nagy erőforrású 'dialektus') és egyiptomi arab (alacsony erőforrású dialektus). Modelljeink mindkettő esetében korszerű eredményeket érnek el. Továbbá az ellentétes képzés jelentősebb javulást eredményez különösen kisebb képzési adatkészletek használata esetén.Abstract
Մորֆոլոգիական նշանները մարտահրավեր են տալիս մորֆոլոգիապես հարուստ լեզուների համար, քանի որ մեծ նպատակային տարածքը և ավելի շատ ուսուցման տվյալների կարիքը նվազեցնելու մոդելի հաճախականությունը: Մորֆոլոգիապես հարուստ լեզուների դիալեկտիկ տարբերակները ավելի շատ տառապում են, քանի որ նրանք ավելի աղմկոտ են և ավելի քիչ ռեսուրսներ ունեն: Այս թղթի մեջ մենք ուսումնասիրում ենք բազմախնդիրների ուսումնասիրության և հակառակ վարժման օգտագործումը, որպեսզի լուծենք մորֆոլոգիական հարստությունը և դիալեկտալ տարբերությունները լիովին մորֆոլոգիական նշանների կոնտեքստում: Մենք օգտագործում ենք բազմախնդիրների ուսումնասիրություն երկու դիալեկտի առանձնահատկությունների համար, ինչպես նաև գիտելիքների փոխանցման համակարգ միջդիալեկտալ մոդելների համար: Մենք օգտագործում ենք հակառակ վարժությունները, որպեսզի սովորենք անընդհատ հատկություններ, որոնք կարող են օգնել գիտելիքների փոխանցման ծրագիրը բարձր և ցածր ռեսուրսների տարբերակներից: Մենք աշխատում ենք երկու դիալեկտալ տարբերակների հետ' ժամանակակից ստանդարտ արաբական (բարձր ռեսուրսների դիալեկտ) և եգիպտացի արաբական (ցածր ռեսուրսների դիալեկտ) միջոցով որպես դեպք ուսումնասիրություն: Մեր մոդելները հասնում են երկուսի համար նորագույն արդյունքներ: Ավելին, հակառակորդ ուսումնասիրությունը ավելի կարևոր բարելավում է, հատկապես փոքր ուսումնասիրության տվյալների համակարգերի օգտագործման ժամանակ:Abstract
Tagging morfologi adalah tantangan untuk bahasa morfologis kaya karena ruang sasaran besar dan kebutuhan untuk lebih banyak data latihan untuk mengurangi kecepatan model. Dialectal variants of morphologically rich languages suffer more as they tend to be more noisy and have less resources. Dalam kertas ini kami mengeksplorasi penggunaan belajar multitask dan pelatihan musuh untuk mengatasi kekayaan morfologi dan variasi dialektal dalam konteks tagging morfologi penuh. Kami menggunakan belajar multitask untuk model morfologi kongsi untuk ciri-ciri dalam dua dialekt, dan sebagai skema pengetahuan-transfer untuk model cross-dialectal. Kami menggunakan latihan lawan untuk belajar ciri-ciri dialekt invarian yang dapat membantu skema pengetahuan-transfer dari variasi tinggi ke sumber daya rendah. Kami bekerja dengan dua varian dialektal: Arab Standard Modern (dialekt sumber daya tinggi) dan Arab Mesir (dialekt sumber daya rendah) sebagai studi kasus. Model kita mencapai hasil terbaik untuk keduanya. Selain itu, pelatihan musuh menyediakan peningkatan yang lebih signifikan ketika menggunakan set data pelatihan yang lebih kecil secara khusus.Abstract
Il tagging morfologico è impegnativo per i linguaggi morfologicamente ricchi a causa dell'ampio spazio di destinazione e della necessità di più dati di allenamento per ridurre al minimo la scarsità del modello. Le varianti dialettali di lingue morfologicamente ricche soffrono di più in quanto tendono ad essere più rumorose e hanno meno risorse. In questo articolo esploriamo l'uso dell'apprendimento multitask e della formazione avversaria per affrontare la ricchezza morfologica e le variazioni dialettali nel contesto del full morfologic tagging. Utilizziamo l'apprendimento multitask per la modellazione morfologica congiunta per le caratteristiche all'interno di due dialetti, e come schema di trasferimento di conoscenze per la modellazione cross-dialettale. Usiamo la formazione avversaria per imparare le caratteristiche invarianti dialettali che possono aiutare lo schema di trasferimento di conoscenze dalle varianti ad alta a bassa risorsa. Lavoriamo con due varianti dialettali: l'arabo standard moderno (dialetto ad alta risorsa) e l'arabo egiziano (dialetto a bassa risorsa) come caso di studio. I nostri modelli raggiungono risultati all'avanguardia per entrambi. Inoltre, la formazione avversaria fornisce miglioramenti più significativi soprattutto quando si utilizzano insiemi di dati di formazione più piccoli.Abstract
標的空間が広く、モデルの希少性を最小限に抑えるためにより多くのトレーニングデータが必要であるため、形態学的タグ付けは形態学的に豊富な言語にとって困難である。 形態的に豊かな言語の方言変種は、より騒音が大きく、資源が少ない傾向にあるため、より多くの被害を受ける。 この論文では、完全な形態学的タグ付けの文脈での形態学的豊かさと方言的バリエーションに対処するためのマルチタスク学習と対抗訓練の使用を探求します。 私たちは、2つの方言内の特徴のための関節形態モデリングのためのマルチタスク学習を使用し、方言間モデリングのための知識移転スキームとして使用しています。 対抗トレーニングを使用して、高いリソースから低リソースのバリアントへの知識移転スキームに役立つ方言の不変機能を学習します。 ケーススタディとして、現代標準アラビア語(高資源「方言」)とエジプトアラビア語(低資源「方言」)の2つの方言変種を取り扱っています。 当社のモデルは、両方とも最先端の結果を達成しています。 さらに、対抗トレーニングは、特に小さなトレーニングデータセットを使用する場合に、より重要な改善を提供します。Abstract
politenessoffpolite"), and when there is a change ("assertive variant Nang pepulan iki kita isikno pengguna gambar nggambar Multitask lan pakan tanggal nggambar nggambar cara-cara wih nyong nggambar Awak dhéwé nggambar multitask seneng nggawe modèling nggawe modèl karo urip iki dialecto, lan nganggo alam-transfer scheme kanggo modèling karo multi-dialectal. Awakdhéwé nglanggar aturan tambah kanggo ngerasai cara-terakhi sing bisa bantuan alam nggawe barang nggawe barang langgar bantuan ingkang dipunangé. Awak dhéwé nglanggar sampeyan duwe dialectal variant: Moderno Standard arab (medium-source 'dialectal') lan diungutan arab sing jipêr (medium-source dialectal) nganggep kuwi basa. modellus kuwi iso nggawe barang-manut karo hal dadi iki dadi. Lahan tambah, curemungan pakan-pakan iku, akeh luwih akeh njaluk kanggo nggawe dataunik sithik kanggo nggawe layang.Abstract
მორფოლოგიური ჩანაწერა მორფოლოგიურად ბეჭდვილი ენებისთვის შესაძლებელია დიდი მიზეზი სივრცე და უფრო მეტი განაწერის მონაცემები, რომ მოდელური სივრცე მინუს მოპორფოლოგიურად ბეჭდვი ენების დიალექტური განრამეტრები უფრო მეტია, როგორც ისინი უფრო ბეჭდვით და უფრო მეტი რესურსი აქვს. ამ დოკუნტში ჩვენ განვიყენებთ მრავალრამეტური სასწავლობა და განაცემების გამოყენება მორპოლოგიური ბედნიერება და დიალექტური გარიაციების გამოყენება მორპოლოგიური მაგ ჩვენ ვიყენებთ მრავალრამეტური მომპოლოგიური მოდელექტის სწავლებისთვის ორი დიალექტის შიგნის ფუნქციებისთვის და როგორც კრავალექტური მოდელექტის ცნობიერები ჩვენ გამოვიყენებთ განსაკუთრებულ განათლებას, რომ დავისწავლოთ დიალექტის განსაკუთრებულ ფუნქციები, რომელიც შეუძლიათ მეცნიერების გადატანსტის სქემის გარე ჩვენ მუშაობთ ორი დიალექტალური განრამეტრებით: მოდინარე სტანდარული არაბული (დიალექტი მეტი რესურსი) და ვფიქტიური არაბული (მალ რესურსის დიალექტი) როგორც ჩვენი მოდელები ორივესთვის წარმოდგენენა. დამატებით, განსაკუთრებული განსწავლება უფრო მნიშვნელოვანელოვანელოვანელოვანელოვანელოვანელოვანელოვანელოვანელოვანელოვანელოვანელოვანელოვანელოვანელოვAbstract
Морфологикалық тегтерді морфологиялық баяны тілдер үлкен мақсатты орынға және үлкен мәліметтерді төмендету үшін көбірек оқыту мәліметтері керек. Морфологиялық баяны тілдердің диалектикалық варианттары көбірек дыбыс болып, ресурстар аз болып тұрады. Бұл қағазда біз көп тапсырманың оқытуын және қарсы оқытуын зерттеп, морфологиялық бағаттығын және диалектикалық түрлендіруді толық морфологиялық тегжелердің контексті туралы ө Біз көптеген тапсырмаларды морфологиялық модельфикациялық модельфикациялық модельфикациялық үшін екі диалект ішіндегі мүмкіндіктер үшін және білім- аудару сұлбасын Біз белсенді оқыту үшін диалекттік керек мүмкіндіктерді оқыту үшін қолданамыз. Бұл білім беру сұлбасының жоғары ресурстардан төмен түрлі варианттарға көмектесет Біз екі диалекталдық альтернативтермен жұмыс істейміз: Қазіргі стандартты арабша (жоғары ресурс 'диалект') және Мысырша арабша (төмен ресурс диалекті) деген үлкен оқу үшін Өзіміздің үлгілеріміз екеуіміздің күйінің нәтижесін жеткізеді. Қосымша, қарсы оқыту үшін кіші оқыту деректер бағдарламаларын қолдану кезінде көбірек жақсарту мүмкіндігін береді.Abstract
목표 공간이 넓고 모델의 희소성을 최소화하기 위해 더 많은 훈련 데이터가 필요하기 때문에 형태학 표기는 형태학이 풍부한 언어에 도전이다.형태가 풍부한 언어의 사투리 변체는 소음이 더 크고 자원이 적기 때문에 더 큰 영향을 받는다.본고에서 우리는 전형태가 표시된 배경에서 다임무 학습과 대항성 훈련을 어떻게 이용하여 형태의 풍부성과 방언의 변이 문제를 해결하는지를 연구했다.우리는 두 가지 사투리 내의 특징에 대해 연합 형태학 모델링을 하고 이를 크로스 사투리 모델링의 지식 이전 방안으로 삼는 것을 다중 임무 학습을 사용한다.우리는 대항적인 훈련을 통해 사투리의 변하지 않는 특징을 배운다. 이런 특징은 지식이 고자원 변체에서 저자원 변체로의 이동에 도움이 된다.우리는 두 가지 방언 변체, 즉 현대 표준 아랍어(고자원'사투리')와 이집트 아랍어(저자원 방언)를 연구했다.우리의 모델은 이 두 방면에서 모두 가장 선진적인 성과를 거두었다.그 밖에 특히 비교적 작은 훈련 데이터 집합을 사용할 때 대항성 훈련은 더욱 현저한 개선을 제공했다.Abstract
Morfologinis ženklinimas morfologiškai turtingoms kalboms kelia sunkumų dėl didelio tikslinio ploto ir poreikio daugiau mokymo duomenų, kad būtų sumažintas modelio nedažnumas. Dialektiniai morfologiškai turtingų kalbų variantai kenčia labiau, nes jie dažniau triukšmingesni ir turi mažiau išteklių. Šiame dokumente tiriame daugiafunkcinio mokymosi ir priešiško mokymo naudojimą siekiant spręsti morfologinį turtingumą ir dialektinius skirtumus visiško morfologinio ženklinimo kontekste. Daugiaužduočių mokymasis naudojamas jungtiniam morfologiniam modeliavimui dviejų dialektų charakteristikų atžvilgiu ir kaip žinių perdavimo sistema tarpdialektiniam modeliavimui. Naudojame priešingą mokymą, kad išmoktume dialektų neatitinkančių savybių, galinčių padėti žinių perdavimo sistemai nuo didelių į mažai išteklių turinčių variantų. Mes dirbame su dviem dialektiniais variantais: šiuolaikiniu standartiniu arabiniu (didelių išteklių dialektu) ir Egipto arabiniu (mažų išteklių dialektu). Our models achieve state-of-the-art results for both. Be to, naudojant mažesnius mokymo duomenų rinkinius, prieštaringas mokymas yra daug geresnis.Abstract
Морфолошките означувања се предизвикувања за морфолошки богати јазици поради големиот простор на мета и потребата од повеќе податоци за обука за минимизирање на репорзитетот на моделот. Дијалектичките варијанти на морфолошки богатите јазици страдаат повеќе бидејќи тие се пошумни и имаат помалку ресурси. Во овој весник ја истражуваме употребата на мултизадачно учење и непријателска обука за решавање на морфолошката богатост и дијалекталните варијации во контекст на целосното морфолошко означување. Користиме мултизадачно учење за заедничко моделирање на моделите за карактеристиките во двете дијалекти, и како шема за трансфер на знаење за крстодијалектално моделирање. Ние користиме непријателска обука за да научиме дијалектни инваријантни карактеристики кои можат да помогнат во шемата на пренесување на знаење од високи до ниски ресурси варијанти. Работиме со два дијалектални варијанти: Модерна стандардна арапска (дијалект со високи ресурси) и египетска арапска (дијалект со ниски ресурси) како случајна студија. Нашите модели постигнуваат најдобри резултати за двајцата. Покрај тоа, непријателската обука обезбедува поголемо подобрување кога се користат посебни помали податоци за обука.Abstract
മോര്ഫോളജിക്കല് ടാഗിങ്ങ് മോര്ഫോളോഗിക്കല് സമ്പന്നരായ ഭാഷകള്ക്ക് വേണ്ടി വിലാസങ്ങള് ചെയ്യുന്നുണ്ട്. അതിനാല് മോഡല് സ് മോര്ഫോളിക്കല് സമ്പന്നരായ ഭാഷകളുടെ ഡയലിക്കല് മാറ്റങ്ങള് കൂടുതല് ശബ്ദമുണ്ടാക്കുന്നത് കൊണ്ടും, കുറച്ച് വി ഈ പത്രത്തില് മുഴുവന് മോര്ഫോളജിക്ക് ടാഗിങ്ങിന്റെ കൂട്ടത്തില് മൊര്ഫോളിക്കല് ടാഗിങ്ങിന്റെ മുഴുവന് വ്യത്യാസങ്ങള്ക്കും വിരോ രണ്ടു ഡയലക്ട്രിക്കുകള്ക്കുള്ള പ്രത്യേകങ്ങള്ക്കുള്ള യോജിപ്പ് മോഡലിങ്കല് പഠിക്കുന്നതിനായി ഞങ്ങള് പല്ലിട്ടിക്ക് ഉപയോഗി നമ്മള് എതിരാളിയായ പരിശീലനം ഉപയോഗിക്കുന്നു. അതില് നിന്നും കുറഞ്ഞ വിഭവങ്ങള് മാറ്റുന്നതില് നിന്നും കുറഞ്ഞ വ്യത്യാസങ്ങള നമ്മള് രണ്ടു ഡയലക്ട്രിക്കല് വേറെന്റുകളുമായി ജോലി ചെയ്യുന്നു; ആധുനിക സ്റ്റാന്റാര്ഡ് അറബി (ഉയര്ന്ന വിഭവങ്ങള് 'ഡയലിക്ക്') മിസ നമ്മുടെ മോഡലുകള് രണ്ടുപേര്ക്കും സ്റ്റേറ്റ് ഫോള്ട്ടില് എത്തുന്നു. കൂടാതെ, വിരോധത്തിനുള്ള പരിശീലനം കൂടുതല് ഗുരുതരമായ മെച്ചപ്പെടുത്തുന്നു. ചെറിയ പരിശീലന ഡാറ്റാസAbstract
Морфологик тегжинг нь маш том зорилготой орон зайд морфологик баян хэлнүүд болон илүү их сургалтын өгөгдлийг багасгах хэрэгтэй. Марфологийн баян хэлнүүдийн диалектик өөрчлөлт илүү чимээгүй, бага нөөц байдаг. Энэ цаасан дээр бид олон ажлын суралцах болон эсрэг суралцах хөдөлгөөнийг судалж, морфологийн баялаг, диалектикийн өөрчлөлтүүдийг бүрэн морфологик маркингийн тухай бодохын тулд судалж байна. Бид олон ажил суралцах сургалтыг хоёр диалектын дотор холбоотой морфологик моделинг ашиглаж, мөн олон диалектикийн моделинг мэдлэг-шилжүүлэх схемийн хувьд ашиглаж байна. Бид эсрэг сургалтыг ашиглаж, мэдлэг шилжүүлэх төлөвлөгөөс өндөрт бага нөөцийн төлөвлөгөөс туслах боломжтой диалектик хүчирхийллийг сурах боломжтой. Бид хоёр диалектикийн хувилбартай ажилладаг: Орчин үеийн Араб стандарт (өндөр ресурс 'диалектик') болон Египет араб (бага нөөц диалектик) судалгааны хувилбар юм. Бидний загварууд хоёр дахь урлагийн төвшин үр дүн гаргадаг. Харин эсрэг сургалт нь жижиг сургалтын өгөгдлийн санг ашиглах үед илүү чухал сайжруулах боломжтой.Abstract
Tagging morfologik adalah menantang bagi bahasa yang kaya secara morfologik disebabkan ruang sasaran besar dan keperluan untuk lebih banyak data latihan untuk mengurangi kecepatan model. Variansi dialektik bahasa yang kaya secara morfologik menderita lebih kerana mereka cenderung menjadi lebih bunyi dan mempunyai sedikit sumber. Dalam kertas ini kami mengeksplorasi penggunaan pembelajaran tugas berbilang dan latihan musuh untuk mengatasi kekayaan morfologi dan variasi dialektal dalam konteks tag morfologi penuh. Kami menggunakan pembelajaran tugas berbilang untuk pemodelan morfologi kongsi untuk ciri-ciri dalam dua dialekt, dan sebagai skema pemindahan-pengetahuan untuk pemodelan dialektal salib. Kami menggunakan latihan musuh untuk belajar ciri-ciri dialekt yang invarian yang boleh membantu skema pemindahan-pengetahuan dari variasi sumber tinggi ke sumber rendah. Kami bekerja dengan dua varian dialektal: Arab Standar Modern (dialekt sumber tinggi) dan Arab Mesir (dialekt sumber rendah) sebagai kajian kes. Model kita mencapai keputusan terbaik untuk kedua-dua. Lagipun, latihan lawan menyediakan peningkatan yang lebih signifikan bila menggunakan set data latihan yang lebih kecil secara khususnya.Abstract
It-tikkettar morfoloġiku huwa ta’ sfida għal lingwi morfoloġikament rikki minħabba l-ispazju l-kbir fil-mira u l-ħtieġa għal aktar dejta ta’ taħriġ biex tiġi minimizzata l-iskarsezza tal-mudell. Varjanti dijalettiċi ta’ lingwi morfoloġikament rikki jbatu aktar minħabba li għandhom it-tendenza li jkunu aktar storbjużi u għandhom inqas riżorsi. In this paper we explore the use of multitask learning and adversarial training to address morphological richness and dialectal variations in the context of full morphological tagging. Aħna nużaw tagħlim multikompiti għall-immudellar morfoloġiku konġunt għall-karatteristiċi fi ħdan żewġ dijaletti, u bħala skema ta’ trasferiment tal-għarfien għall-immudellar transdijalettiku. Aħna nużaw taħriġ avversarju biex nitgħallmu karatteristiċi invarjanti tad-dijalekt li jistgħu jgħinu fl-iskema tat-trasferiment tal-għarfien mill-varjanti għoljin għal dawk b’riżorsi baxxi. We work with two dialectal variants: Modern Standard Arabic (high-resource 'dialect'') and Egyptian Arabic (low-resource dialect) as a case study. Il-mudelli tagħna jiksbu riżultati moderni għat-tnejn li huma. Barra minn hekk, it-taħriġ avversarju jipprovdi titjib aktar sinifikanti meta jintużaw settijiet ta’ dejta ta’ taħriġ iżgħar b’mod partikolari.Abstract
Morfologische tagging is een uitdaging voor morfologisch rijke talen vanwege de grote doelruimte en de behoefte aan meer trainingsgegevens om de schaarste van het model te minimaliseren. Dialectische varianten van morfologisch rijke talen lijden meer omdat ze over het algemeen luidruchtiger zijn en minder middelen hebben. In dit artikel onderzoeken we het gebruik van multitask learning en adversaire training om morfologische rijkdom en dialectische variaties aan te pakken in de context van volledige morfologische tagging. We gebruiken multitask learning voor gezamenlijke morfologische modellering van de kenmerken binnen twee dialecten, en als een kennisoverdracht schema voor cross-dialectische modellering. We gebruiken tegenstrijdige training om dialectinvariante eigenschappen te leren die het kennisoverdrachtsschema van de hoge naar lage resource varianten kunnen helpen. We werken met twee dialectische varianten: Modern Standaard Arabisch (high-resource 'dialect') en Egyptisch Arabisch (low-resource dialect) als case study. Onze modellen bereiken state-of-the-art resultaten voor beide. Bovendien levert adversariaal training met name bij het gebruik van kleinere trainingsdatasets een grotere verbetering op.Abstract
Morfologisk merking er vanskeleg for morfologisk rike språk på grunn av det store målsrommet og nødvendighet for meir opplæringsdata for å minimera modellen sparsitet. Dialektiske variantar av morfologisk rike språk kjører meir sidan dei treng til å vera meir støy og har mindre ressursar. I denne papiret utforskar vi bruken av multioppgåver- læring og adversarøvinga for å handtera morfologiske rykkhet og dialektiske variasjonar i konteksten av fullstendig morfologisk merking. Vi bruker fleire oppgåver med å læra fleire oppgåver for joint morphological modeling for funksjonane i to dialektar, og som kjenningsoverføringsskjema for krysdialektisk modeling. Vi bruker negativ opplæring for å lære invariant funksjonar for dialekt som kan hjelpa opplæringa for kunnskap-overføring frå dei høge til låge ressursvariantane. Vi arbeider med to dialektiske variantar: Modern Standard Arabic (høg- ressurs « dialect ») og Egyptian Arabic (låg- ressursdialekt) som ein tilfeldige studie. Modellene våre oppnår resultatet av kunsten for begge. I tillegg er det viktigere å forbedra kontrateralisk opplæring når du brukar mindre opplæringsdataset.Abstract
Tagowanie morfologiczne jest wyzwaniem dla języków bogatych morfologicznie ze względu na dużą przestrzeń docelową i potrzebę większej ilości danych treningowych w celu zminimalizowania słabości modelu. Dialektalne warianty języków bogatych morfologicznie cierpią bardziej, ponieważ są bardziej hałaśliwe i mają mniejsze zasoby. W niniejszym artykule badamy wykorzystanie wielozadaniowego uczenia się i szkolenia przeciwnego do zajęcia się bogactwem morfologicznym i wariacjami dialektu w kontekście pełnego tagowania morfologicznego. Wykorzystujemy wielozadaniowe uczenie się do wspólnego modelowania morfologicznego cech w obrębie dwóch dialektów oraz jako schemat transferu wiedzy do modelowania między dialektami. Używamy szkolenia przeciwnego, aby nauczyć się cech niezmiennych dialektu, które mogą pomóc w systemie transferu wiedzy z wariantów wysokich do wariantów niskich zasobów. Pracujemy z dwoma wariantami dialektu: współczesnym standardowym arabskim (wysokiej jakości "dialekt") i egipskim arabskim (niskiej jakości dialekt) jako studium przypadku. Nasze modele osiągają najnowocześniejsze wyniki w obu przypadkach. Ponadto szkolenie przeciwne zapewnia znaczniejszą poprawę, w szczególności przy wykorzystaniu mniejszych zbiorów danych szkoleniowych.Abstract
A marcação morfológica é um desafio para linguagens morfologicamente ricas devido ao grande espaço de destino e à necessidade de mais dados de treinamento para minimizar a dispersão do modelo. Variantes dialetais de línguas morfologicamente ricas sofrem mais, pois tendem a ser mais ruidosas e possuem menos recursos. Neste artigo, exploramos o uso do aprendizado multitarefa e do treinamento adversário para abordar a riqueza morfológica e as variações dialetais no contexto da marcação morfológica completa. Usamos o aprendizado multitarefa para modelagem morfológica conjunta para os recursos dentro de dois dialetos e como um esquema de transferência de conhecimento para modelagem cross-dialetal. Usamos o treinamento adversário para aprender recursos invariantes de dialeto que podem ajudar o esquema de transferência de conhecimento das variantes de alto para baixo recurso. Trabalhamos com duas variantes dialetais: árabe padrão moderno (dialeto de alto recurso) e árabe egípcio (dialeto de baixo recurso) como estudo de caso. Nossos modelos alcançam resultados de última geração para ambos. Além disso, o treinamento adversário fornece uma melhoria mais significativa ao usar conjuntos de dados de treinamento menores em particular.Abstract
Etichetarea morfologică reprezintă o provocare pentru limbile bogate din punct de vedere morfologic datorită spațiului țintă mare și nevoii de mai multe date de formare pentru a minimiza scara modelului. Variantele dialecte ale limbilor bogate din punct de vedere morfologic suferă mai mult, deoarece tind să fie mai zgomotoase și au mai puține resurse. În această lucrare explorăm utilizarea învățării multitask și a pregătirii adversare pentru a aborda bogăția morfologică și variațiile dialectale în contextul etichetării morfologice complete. Folosim învățarea multitask pentru modelarea morfologică comună a caracteristicilor din două dialecte și ca schemă de transfer de cunoștințe pentru modelarea cross-dialectală. Folosim instruirea adversară pentru a învăța caracteristici invariante dialecte care pot ajuta schema de transfer de cunoștințe de la variantele cu resurse mari la cele cu resurse reduse. Lucrăm cu două variante dialectale: Araba standard modernă (dialect cu resurse mari) și arabă egipteană (dialect cu resurse reduse) ca studiu de caz. Modelele noastre obțin rezultate de ultimă generație pentru ambele. În plus, formarea adversară oferă îmbunătățiri mai semnificative atunci când se utilizează seturi de date mai mici de formare, în special.Abstract
Морфологическая маркировка является сложной задачей для морфологически богатых языков из-за большого целевого пространства и необходимости большего количества обучающих данных для минимизации скудности модели. Диалектные варианты морфологически богатых языков страдают больше, поскольку они, как правило, более шумны и имеют меньше ресурсов. В этой статье мы исследуем использование многозадачного обучения и состязательного обучения для решения морфологического богатства и диалектных вариаций в контексте полной морфологической маркировки. Мы используем многозадачное обучение для совместного морфологического моделирования признаков в пределах двух диалектов и в качестве схемы передачи знаний для кросс-диалектного моделирования. Мы используем состязательное обучение для изучения диалектных инвариантных особенностей, которые могут помочь схеме передачи знаний от высокоресурсного к низкоресурсному варианту. В качестве примера мы работаем с двумя диалектными вариантами: современным стандартным арабским (высокоресурсный «диалект») и египетским арабским (малоресурсный диалект). Наши модели достигают самых современных результатов для обоих. Кроме того, состязательная подготовка обеспечивает более значительное улучшение при использовании, в частности, меньших наборов учебных данных.Abstract
මොර්ෆෝලෝජික ටැග් එක ප්රශ්නයක් වෙන්නේ මොර්ෆෝලෝජික විශාල භාෂාවට ප්රශ්නයක් වෙන්නේ ලොකු ලක්ෂ මාර්ෆෝලෝජික භාෂාවන්ගේ ප්රශ්ණ වෙනස් වර්ගයක් විතරයි ඔවුන්ට වඩා ශබ්ද විතරයි වගේ මේ පත්තරේ අපි ගොඩක් වැඩක් ඉගෙනගන්න සහ විරෝධික ප්රශ්නයක් භාවිතා කරනවා මොර්ෆෝලෝජික විශේෂතාවය සහ විරෝ අපි ගොඩක් වැඩක් ඉගෙන ගන්න පාවිච්චි කරන්නේ සාමාන්ය විද්යාලික විද්යාලික විද්යාලික විද්යාලික විද්යාලය දෙකක් අපි පාවිච්චි විරෝධ ප්රශ්නයක් පාවිච්චි කරනවා ඩායලෙක්ට් අවශ්ය විශේෂතාවක් ඉගෙන ගන්න, ඒකෙන් දන අපි ඩායිලෙක්ටල් වර්ජනය දෙකත් එක්ක වැඩ කරනවා: අද්යුතික ස්ථානය අරාබික් (උත්සත්වය 'ඩායිලක්') සහ ඊජිප්තිය අරාබ අපේ මෝඩේල් එක්ක දෙන්නටම තත්වයේ ඉන්න ප්රතිචාරයක් ලැබෙනවා. තවත්, විරෝධ විරෝධ විශේෂයෙන් විශේෂ විශේෂයෙන් ප්රශ්නයක් විශේෂයෙන් ප්රශ්නයකAbstract
Morfološko označevanje je izziv za morfološko bogate jezike zaradi velikega ciljnega prostora in potrebe po več podatkih o usposabljanju, da bi zmanjšali redkost modela. Dialektne različice morfološko bogatih jezikov bolj trpijo, saj so običajno bolj hrupne in imajo manj virov. V prispevku raziskujemo uporabo večopravilnega učenja in kontradiktorskega usposabljanja za obravnavanje morfološkega bogastva in dialektičnih variacij v kontekstu popolnega morfološkega označevanja. Večopravilno učenje uporabljamo za skupno morfološko modeliranje značilnosti znotraj dveh narečij in kot shemo prenosa znanja za mednarečno modeliranje. Uporabljamo kontradiktorsko usposabljanje za učenje narečnih invariantnih funkcij, ki lahko pomagajo shemi prenosa znanja od različic visokih do nizkih virov. Delamo z dvema narečnima različicama: sodobno standardno arabščino (narečje z visokimi viri) in egiptovsko arabščino (narečje z nizkimi viri) kot študijo primera. Naši modeli dosegajo najsodobnejše rezultate za obe. Poleg tega konkurenčno usposabljanje zagotavlja bistveno izboljšanje zlasti pri uporabi manjših naborov podatkov o usposabljanju.Abstract
Morphological tagging is challenging for morphologically rich languages due to the large target space and the need for more training data to minimize model sparsity. Iskhilaafka kala duwan ee luuqadaha hodanka ah ee morphologisk ah waxey ku xanuunsadaan si ka badan marka ay yihiin dhawaaq badan oo ay haystaan hanti ka yar. Qoraalkan waxaynu ka baaraynaa isticmaalka waxbarashada badan iyo waxbarashada cadaawayaasha ah si aan ugu hadlno barwaaqada morphologiga iyo bedelka kala duduwan marka lagu qoro qoraalka oo dhan. Waxaynu u isticmaalnaa barashada wax badan oo ku saabsan tusaale-muuqashada wadajirka ah ee noocyada labo luuqadood gudahooda, iyo qorshaha aqoonta beddelinta, tusaale-qaabka kala duwan. Waxaynu isticmaalnaa waxbarashada cadaawayaasha ah si aan u barno aqoonta qaabilaadda ah, kaas oo caawinaya qorshaha aqoonta lagaga wareejiyo meelaha sare iyo kuwa hoos u dhexeeya. Waxaynu ku shaqaynaynaa laba kala duduwan: Modern Standard Carabi (high resource 'dialect') iyo Egyptian (low-resource dialect) as a case study. Tusaalooyinkayada waxay labadooda u helaan arimaha farshaxanka. Sidoo kale waxbarashada cadaawayaasha ka geesta ah waxaa laga heli karaa hagitaan aad u weyn marka aad isticmaaleyso koorasyada waxbarashada yar ee gaar ah.Abstract
Etiketimi morfologjik është sfidues për gjuhët morfologjikisht të pasura për shkak të hapësirës së madhe objektiv dhe nevojës për më shumë të dhëna trainimit për të minimizuar pakësinë e modelit. Variante dialektike të gjuhëve morfologjikisht të pasura vuajnë më shumë pasi ato tenderojnë të jenë më zhurmëshme dhe kanë më pak burime. Në këtë letër ne eksplorojmë përdorimin e mësimit multidetyror dhe trajnimit kundërshtar për të trajtuar pasurinë morfologjike dhe variacionet dialektale në kontekstin e etiketave morfologjike të plota. Ne përdorim mësimin e shumëdetyrave për modelimin e përbashkët morfologjik për karakteristikat brenda dy dialekteve dhe si një skemë transferimi i njohurive për modelimin ndërdialektal. Ne përdorim trajnimin kundërshtar për të mësuar karakteristika dialektike invariante që mund të ndihmojnë skemën e transferimit të njohurive nga variantet e larta në të ulta të burimeve. We work with two dialectal variants: Modern Standard Arabic (high-resource 'dialect') and Egyptian Arabic (low-resource dialect) as a case study. Modelet tona arrijnë rezultate moderne për të dy. Përveç kësaj, stërvitja kundërshtare ofron përmirësim më të rëndësishëm kur përdorin në veçanti grupe të dhënash më të vogla të stërvitjes.Abstract
Morfološki etiketiranje je izazovno za morfološki bogate jezike zbog velikog ciljnog prostora i potrebe za većim podacima obuke za minimizaciju modela sparsiteta. Dijalektalne variante morfološki bogatih jezika pati više jer su navikli da budu buksniji i imaju manje resursa. U ovom papiru istražujemo korištenje multitask učenja i adversarnog treninga kako bi se obratili morfološkom bogatstvu i dijalektičkim varijacijama u kontekstu punog morfološkog oznake. Koristimo učenje multitask a za zajedničku morfološku modelizaciju za karakteristike unutar dva dijalekta, i kao šemu prebacivanja znanja za prekidajelektnu modelizaciju. Koristimo neprijateljsku obuku da naučimo invariantne karakteristike dijalekta koji mogu pomoći šemu prenošenja znanja iz visokih na niske resurse. Radimo sa dva dijalektalna varijanta: moderni standardni arapski (visoki resursi 'dijalekt') i egipatski arapski (niski dijalekt resursa) kao studija slučajeva. Naši modeli postignu rezultate umjetnosti za oboje. Osim toga, neprijateljska obuka pruža značajnije poboljšanje kada koristi manje podatke za obuku posebno.Abstract
Morfologisk märkning är utmanande för morfologiskt rika språk på grund av det stora målutrymmet och behovet av mer träningsdata för att minimera modellspartiteten. Dialektiska varianter av morfologiskt rika språk lider mer eftersom de tenderar att vara mer bullriga och har mindre resurser. I den här uppsatsen undersöker vi användningen av multitasking lärande och kontradiktorisk träning för att hantera morfologisk rikedom och dialektiska variationer i samband med full morfologisk taggning. Vi använder multitask lärande för gemensam morfologisk modellering för funktionerna inom två dialekter, och som kunskapsöverföringsschema för korsdialektisk modellering. Vi använder kontradiktorisk träning för att lära oss dialektinvarianta funktioner som kan hjälpa kunskapsöverföringssystemet från hög till låg resurs varianter. Vi arbetar med två dialektiska varianter: Modern Standard Arabic (high-resource 'dialect') och Egyptian Arabic (low-resource dialect) som fallstudie. Våra modeller ger toppmoderna resultat för båda. Dessutom ger motprestationsutbildning större förbättringar när det gäller användning av mindre utbildningsdataset.Abstract
Ujumbe wa kifolojia unachangamoto kwa lugha zenye utajiri wa kifolojia kwa sababu ya nafasi kubwa ya malengo na haja ya takwimu zaidi za mafunzo ili kupunguza kiwango cha utoaji wa mifano. Mabadiliko ya lugha zenye utajiri wa kifolojia yanakabiliwa zaidi kwa sababu ya kuwa na kelele zaidi na wana rasilimali ndogo. Katika gazeti hili tunatafuta matumizi ya kujifunza na mafunzo ya kinyume ya kutangaza utajiri wa kifolojia na mabadiliko ya kiutaalamu katika muktadha wa wimbo kamili wa kimaadilojia. Tunatumia kujifunza kwa ajili ya muundo wa pamoja wa simu za morphological kwa vipengele viwili ndani ya lugha mbili, na kama mpango wa usafirishaji wa maarifa kwa kutengeneza mifano yenye tofauti. Tunatumia mafunzo ya upinzani ili kujifunza kutangaza vipengele vya uvamiaji ambavyo vinaweza kusaidia mpango wa usafirishaji wa maarifa kutoka kwenye mabadiliko ya juu hadi rasilimali chini. We work with two dialectal variants: Modern Standard Arabic (high-resource 'dialect') and Egyptian Arabic (low-resource dialect) as a case study. Mifano yetu hupata matokeo ya hali ya sanaa kwa wote. Zaidi ya hayo, mafunzo ya upinzani yanatoa maendeleo makubwa zaidi pale kutumia seti za mafunzo madogo hasa.Abstract
பெரிய இலக்கு இடைவெளியில் இருந்து மாதிரி சிறிதாக்குவதற்கு மேலும் பயிற்சி தரவு தேவை மோர்போலியல் பணக்கூடிய மொழிகளின் வேறுபாடுகள் மேலும் சப்தமாக இருக்கும் மற்றும் குறைவான வளங்கள் இருக்கும இந்த காகிதத்தில் நாம் முழு morphological ஒட்டுதலில் மாறுபாடுகளை முழுமையான மாறுபாடுகளை முழுமையான மாறுபாடுகளை முடியும். நாம் இரண்டு விளக்கச்சீட்டுகளிலுள்ள தன்மைகளுக்கான இணைப்பு மாதிரிக்கத்திற்கான பல்டிக்கோர் கற்றலை பயன்படுத்துகிறோம், மற்றும் மா நாம் எதிர்மறை பயிற்சியை பயன்படுத்துகிறோம் அது உயரிலிருந்து குறைந்த மூலத்தின் மாறிகளிலிருந்து அறிவு மாற்றும் திட்டத நாம் இரண்டு வேறு வேறுபாடுகளுடன் வேலை செய்கிறோம்: தற்போதைய நிலையான அரபி (உயர்மூலத்திற்கு 'dialect') மற்றும் எகிப்தியன் (குறைந்த மூலத் நம்முடைய மாதிரிகள் இருவருக்கும் நிலையில் கலை முடிவுகளை பெறுகிறது. அதற்கு மேலும், எதிர்கால பயிற்சி சிறிய பயிற்சி தரவு அமைப்புகளை பயன்படுத்தும்போது மிகவும் முக்கியமான முAbstract
Marfolojik tägleme morfolojik baý diller üçin uly maksadyň ýerini üçin kynçylyk däldir we nusgasyny azaltmak üçin köp bilim maglumatyny taýýarlamak üçin kynçylyk edýär. Morfoloýlyk baý dilleriniň dijaletiýatlyk üýtgeşmeleri has gaty sesli bolup, ýöne kiçi çeşmeleri bar. Bu kağıtda morfolojik zenginliği ve dialektal değişiklikleri dolu morfolojik taglama kontekstinde çözmek üçin çoklu görev öwrenmesini ve düşmanlyk eğitimini inceleýäris. Biz iki dialekt içinde özellikler üçin morfolojik modellendirmek üçin bir çoklu täbligi öwrenmek üçin ullanýarys we cross-dialektal modellendirmek üçin bir bilim-terjime taslama üçin ullanýarys. Biz dialektiýanyň iň ýokary çeşmelerinden iň ýokary çeşmelerden iň ýokary çeşmelere kömek edip biljek hasaplanjar eğitimi ulanýarys. Biz iki dialektal wariant bilen işleýäris: Modern Standard Arabic (high-resource 'dialect') we Egipça Arapça (low-resource dialect) kiçi bir eser bolup. Biziñ nusgalarymyz ikisi üçin ýagdaýyň durumyny ýetip barýar. Mundan soňra, täsirli eğitim kiçiräk okuw sanlaryny belli şeklinde ulananda has gowurak gowurak berer.Abstract
Morphological tagging is challenging for morphology rich languages due to the large target space and the need for more training data to minimize model sparsity. اس طرح کہ ان کی آواز زیادہ ہے اور کم سرمایہ رکھتے ہیں. اس کاغذ میں ہم ملتی ٹاکس کی تعلیم اور مخالفت کی تعلیم کے استعمال کی استعمال کی تحقیق کرتے ہیں کہ پورے مورفولوژیکی ٹاکنگ کے بارے میں مورفولوژیکی ثروت اور دیالکتل تغییروں کے بارے میں استعمال کریں۔ ہم ملتی ٹاکس کی تعلیم کی استعمال کر رہے ہیں دو ڈائیلکتوں کے اندر ویژگی کے لئے، اور cross-dialectal modeling کے لئے علم-transfer طریقہ کے طور پر. ہم مخالف تعلیم کا استعمال کرتے ہیں کہ ڈیلکسٹ غیر غیر غیر غیر غیر غیر غیر غیر غیر غیر غیر غیر غیر غیر غیر غیر غیر غیر غیر غیر غیر غیر ہم دو ڈیلکتال الفاظت کے ساتھ کام کرتے ہیں: Modern Standard Arabic (high-resource 'dialect') اور مصری عربی (low-resource dialect) کو ایک کیس مطالعہ کے طور پر۔ ہماری مدل دونوں کے لئے موقعیت کا نتیجہ پہنچا رہی ہے۔ اور اس کے علاوہ، مخالف تربیت کی تعلیم اس سے زیادہ اضافہ کرتا ہے جب چھوٹی تربیت ڈیٹسٹ استعمال کرتے ہیں۔Abstract
Name Morfologik hosil tillardan dialektikal variantlar ko'proq holatda o'xshash va ko'proq manbalar bor. Bu qogʻozda, biz butun morfologik tagg'ining davrida o'rganish va foydalanuvchi o'rganishni foydalanamiz. Biz ikkita dialeklar ichida bir xil morfologik modeli uchun multitask o'rganish uchun foydalanamiz, va bir necha dialekal model uchun ilmiy transfer qolipi. Biz foydalanuvchi taʼminlovchidan foydalanamiz. Bu ilmiy qolipni yuqoriga kamaytirish imkoniyatlaridan kamaytirish imkoniyatlariga yordam beradi. Biz ikkita dialektikal varianter bilan ishlayapmiz: Modern Standard Arabi (yuqori resource 'dialect') va Misri arab (kamayt resource dialekasi) kabi o'qituvchi taʼminot sifatida. Bizning modellarimiz ikkita shaxsiy natijaga ega bo'ladi. Ko'rsatilgan foydalanuvchi taʼminlovchisi foydalanayotganda juda muhim o'zgarishga ega bo'ladi.Abstract
Theo dấu kiểu Morphological Thách thức cho các ngôn ngữ giàu có lịch sử nhờ vào khoảng trống lớn của mục tiêu và sự cần thêm dữ liệu đào tạo để giảm thiểu chủng tộc mô hình. Nhiều biến thể từ ngữ học của các ngôn ngữ giàu có có có có có hình thức ồn ào hơn và có ít nguồn lực hơn. Trong tờ giấy này, chúng tôi khám phá cách sử dụng việc học nhiều nhiệm vụ và giáo dục đối nghịch để đối phó với độ giàu lịch sử và biến dạng địa phương trong trường hợp mang đầy đủ hình. Chúng tôi sử dụng nghiên cứu đa nhiệm vụ cho việc sắp xếp hình mẫu chung cho các đặc điểm trong hai phương ngữ, và như một phương pháp truyền đạt kiến thức cho tạo mẫu địa phương. Chúng tôi sử dụng giáo dục đối thủ để học các tính năng xâm lược của ngôn ngữ có thể giúp đỡ bộ trình truyền tri thức từ biến thể cao đến thấp nguồn. Chúng tôi làm việc với hai biến thể phương ngữ học: Tiếng Ả Rập Hiện Đại Chuẩn (phương ngữ) với một nguồn "đa số" và tiếng Ả Rập Ai Cập (phương ngữ ít tài nguyên). Các mẫu đạt được kết quả tối tân cho cả hai. Hơn nữa, huấn luyện đối thủ sẽ cải thiện đáng kể hơn khi sử dụng các tập tin nhỏ hơn.Abstract
形之于言,一也;虚也,大也;多教数,最小化疏也。 语言方言变体受苦更多,以其往往嘈杂,资源益少也。 本文之中,讨论用多任务学抗练背景解形丰富性方言变化。 吾以多任务学合形建模,而为跨方言建模移方。 吾以对抗性训习方言不变,可以助知移方变体至于低资源变体。 臣等用二言变体:今代格阿拉伯语(高资源"方言")与埃及阿拉伯语(低资源方言)为例。 吾形为两者,皆得最先进。 此外特于用小练数集时,抗练更著者改进。- Anthology ID:
- P19-1173
- Volume:
- Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics
- Month:
- July
- Year:
- 2019
- Address:
- Florence, Italy
- Venue:
- ACL
- SIG:
- Publisher:
- Association for Computational Linguistics
- Note:
- Pages:
- 1775–1786
- Language:
- URL:
- https://aclanthology.org/P19-1173
- DOI:
- 10.18653/v1/P19-1173
- Bibkey:
- Cite (ACL):
- Nasser Zalmout and Nizar Habash. 2019. Adversarial Multitask Learning for Joint Multi-Feature and Multi-Dialect Morphological Modeling. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pages 1775–1786, Florence, Italy. Association for Computational Linguistics.
- Cite (Informal):
- Adversarial Multitask Learning for Joint Multi-Feature and Multi-Dialect Morphological Modeling (Zalmout & Habash, ACL 2019)
- Copy Citation:
- PDF:
- https://aclanthology.org/P19-1173.pdf
- Video:
- https://vimeo.com/384512599
- Terminologies:
Export citation
@inproceedings{zalmout-habash-2019-adversarial, title = "Adversarial Multitask Learning for Joint Multi-Feature and Multi-Dialect Morphological Modeling", author = "Zalmout, Nasser and Habash, Nizar", booktitle = "Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics", month = jul, year = "2019", address = "Florence, Italy", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/P19-1173", doi = "10.18653/v1/P19-1173", pages = "1775--1786", }
<?xml version="1.0" encoding="UTF-8"?> <modsCollection xmlns="http://www.loc.gov/mods/v3"> <mods ID="zalmout-habash-2019-adversarial"> <titleInfo> <title>Adversarial Multitask Learning for Joint Multi-Feature and Multi-Dialect Morphological Modeling</title> </titleInfo> <name type="personal"> <namePart type="given">Nasser</namePart> <namePart type="family">Zalmout</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Nizar</namePart> <namePart type="family">Habash</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <originInfo> <dateIssued>2019-07</dateIssued> </originInfo> <typeOfResource>text</typeOfResource> <relatedItem type="host"> <titleInfo> <title>Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics</title> </titleInfo> <originInfo> <publisher>Association for Computational Linguistics</publisher> <place> <placeTerm type="text">Florence, Italy</placeTerm> </place> </originInfo> <genre authority="marcgt">conference publication</genre> </relatedItem> <identifier type="citekey">zalmout-habash-2019-adversarial</identifier> <identifier type="doi">10.18653/v1/P19-1173</identifier> <location> <url>https://aclanthology.org/P19-1173</url> </location> <part> <date>2019-07</date> <extent unit="page"> <start>1775</start> <end>1786</end> </extent> </part> </mods> </modsCollection>
%0 Conference Proceedings %T Adversarial Multitask Learning for Joint Multi-Feature and Multi-Dialect Morphological Modeling %A Zalmout, Nasser %A Habash, Nizar %S Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics %D 2019 %8 July %I Association for Computational Linguistics %C Florence, Italy %F zalmout-habash-2019-adversarial %R 10.18653/v1/P19-1173 %U https://aclanthology.org/P19-1173 %U https://doi.org/10.18653/v1/P19-1173 %P 1775-1786
Markdown (Informal)
[Adversarial Multitask Learning for Joint Multi-Feature and Multi-Dialect Morphological Modeling](https://aclanthology.org/P19-1173) (Zalmout & Habash, ACL 2019)
- Adversarial Multitask Learning for Joint Multi-Feature and Multi-Dialect Morphological Modeling (Zalmout & Habash, ACL 2019)
ACL
- Nasser Zalmout and Nizar Habash. 2019. Adversarial Multitask Learning for Joint Multi-Feature and Multi-Dialect Morphological Modeling. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pages 1775–1786, Florence, Italy. Association for Computational Linguistics.