Choosing Transfer Languages for Cross-Lingual Learning Kies Oordrag Taal vir Kruis- Linguaal Leer ቋንቋዎች اختيار لغات التحويل للتعلم عبر اللغات 칂톛rz dill톛ri 칬yr톛nm톛k 칲칞칲n Transfer dill톛rini se칞ir Избор на трансферни езици за междулингвистично обучение Choosing Transfer Languages for Cross-Lingual Learning Cross-Lingual Learning པར་སྤོར་སྐད་རིགས་འདེམས་པ Izabranje prijenosnih jezika za krstoLingualno učenje Seleccionar llengües de transferència per l'aprenentatge translingüe Výběr přenosových jazyků pro mezijazyčné učení Valg af overførselssprog til tværsproglig læring Auswahl von Transfersprachen für das sprachübergreifende Lernen Επιλογή γλωσσών μεταφοράς για τη γλωσσική μάθηση Elección de idiomas de transferencia para el aprendizaje multilingüe Ülekandekeelte valimine keeleülese õppe jaoks انتخاب کردن زبانهای انتقال برای یادگیری متصل زبان Siirtokuntien valinta kielienväliseen oppimiseen Choix des langues de transfert pour l'apprentissage multilingue Teangacha Aistrithe a Roghnú don Fhoghlaim Trastheangach KCharselect unicode block name בחרת שפות העברה ללימודי שפתיים क्रॉस-लिंगुअल लर्निंग के लिए स्थानांतरण भाषाओं का चयन करना Izabranje prijenosnih jezika za preko jezika učenje A transzfer nyelvek kiválasztása a többnyelvű tanuláshoz Choosing Transfer Languages for Cross-Lingual Learning Memilih Bahasa Transfer untuk Belajar Selasa Bahasa Scelta delle lingue di trasferimento per l'apprendimento interculturale クロスリンガル学習のための転送言語の選択 milih kanggo langgambar kanggo kelas-Lingmulai ძირითადი სიტყვების მესწავლებისთვის გადარჩევა Қосымсыз тіл оқыту тілдерін таңдау 다중 언어 학습을 위한 마이그레이션 언어 선택 Kalbų perdavimo tarpkalbiniam mokymuisi pasirinkimas Choosing Transfer Languages for Cross-Lingual Learning ക്രോസ്- ലിങ്ഗല് പഠിക്കുന്നതിനായി മാറ്റുന്ന ഭാഷകള് തെരഞ്ഞെടുക്കുന്നു Дөрвөн хэл суралцах хэлнүүдийг сонгох Pilih Bahasa Pemindahan untuk Belajar Selasa-Bahasa L-Għażla tal-Lingwi ta’ Trasferiment għat-Tagħlim Translingwali Het kiezen van overdrachttalen voor crosslinguaal leren Vel overføringspråk for krysslingslæring Wybór języków transferowych do uczenia się między językami Escolhendo idiomas de transferência para aprendizado entre idiomas Alegerea limbilor de transfer pentru învățarea interlingvistică Выбор языков перевода для кросс-лингвального обучения ක්රෝස් ලින්ගුවාල් ඉගෙනීම සඳහා භාෂාව තෝරාගන්න Izbira prenosnih jezikov za medjezikovno učenje Dalbashada luuqadaha iskuulka luqada Zgjidh gjuhët e transferimit për mësimin ndërgjuhësor Izabranje prijenosnih jezika za krstoLingualno učenje Välja överföringsspråk för tvärspråkligt lärande Kuchagua lugha za Uhamiaji kwa ajili ya Kufundisha Kirusi குறுக்கு- மொழி கற்றுக்கான மொழிகளை மாற்றும் மொழிகளை தேர்ந்தெடுக்கவும் Çapraz Diller öwrenmek üçin terjime dilleri saýlamak Cross-Lingual Learning کے لئے ترنسفر زبانیں انتخاب کرنا ہے Name Chọn ngôn ngữ truyền dịch cho giáo dục xuyên chữ 为跨语学择移语
Yu-Hsiang Lin, Chian-Yu Chen, Jean Lee, Zirui Li, Yuyan Zhang, Mengzhou Xia, Shruti Rijhwani, Junxian He, Zhisong Zhang, Xuezhe Ma, Antonios Anastasopoulos, Patrick Littell, Graham Neubig
Abstract
Cross-lingual transfer, where a high-resource transfer language is used to improve the accuracy of a low-resource task language, is now an invaluable tool for improving performance of natural language processing (NLP) on low-resource languages. However, given a particular task language, it is not clear which language to transfer from, and the standard strategy is to select languages based on ad hoc criteria, usually the intuition of the experimenter. Since a large number of features contribute to the success of cross-lingual transfer (including phylogenetic similarity, typological properties, lexical overlap, or size of available data), even the most enlightened experimenter rarely considers all these factors for the particular task at hand. In this paper, we consider this task of automatically selecting optimal transfer languages as a ranking problem, and build models that consider the aforementioned features to perform this prediction. In experiments on representative NLP tasks, we demonstrate that our model predicts good transfer languages much better than ad hoc baselines considering single features in isolation, and glean insights on what features are most informative for each different NLP tasks, which may inform future ad hoc selection even without use of our method.Abstract
Cross-lingual oordrag, waar 'n hoë-hulpbron oordrag taal gebruik word om die presisie van 'n lae-hulpbron taal te verbeter, is nou 'n ongeluitbare hulpbron vir die verbetering van presisie van natuurlike taal verwerking (NLP) op lae-hulpbron taal. Maar gegee het 'n bepaalde taal, dit is nie duidelik wat taal moet oordra van, en die standaard strategie is om tale te kies gebaseer op ad hoc kriteries, gewoonlik die intuisie van die eksperimenteerder. Omdat 'n groot aantal funksies bydra aan die sukses van kruistale oordrag (insluitend filogenetiese gelykenis, tipologiese eienskappe, leksiese oordrag, of grootte van beskikbaar data), selfs die mees verligte eksperimenter rarelik besluit al hierdie faktore vir die bepaalde taak aan die hand. In hierdie papier, ons beskou hierdie taak van automaties kies optimale oordrag tale as 'n ranking probleem, en bou modele wat beskou die voorgestelde funksies om hierdie voorskou te doen. In eksperimente op reprezentante NLP-opdragte, wys ons dat ons model voorskou goeie oordragspraak tale baie beter as ad hoc basisline met aanmerking van enkele funksies in isolation en glean inligtings oor watter funksies mees informatief is vir elke verskillende NLP-opdragte, wat dalk kan toekomstige ad hoc-keuse inligtig selfs sonder gebruik van ons metode.Abstract
ቋንቋ-ቋንቋ ተወስዶ፣ ከፍተኛ resource transfer ቋንቋ ለማሻሻል የተጠቀመው የራስ-resource ቋንቋን ማስታወቂያውን ለማድረግ፣ አሁን የፍጥረት ቋንቋ ፕሮጀክት (NLP) በሚያበጀው ቋንቋ ቋንቋ ማድረግ የማይጠቅመው ዕቅድን ነው፡፡ ነገር ግን የተለየ የስራ ቋንቋ የተሰጠ፣ ከየትኛው ቋንቋ ለመለወጥ አይገልጽም፣ የደካማው strategy በአካባቢው ግንኙነት በተመሳሳይ አካባቢ የተፈታተኞቹን ዓይነት ለመምረጥ ነው፡፡ ብዙ ምርጫዎች በኩል የቋንቋ ስልክ (የፊልogenetic ብጤት፣ ቶሎጂካዊ ምርጫዎች፣ የሊክሲካዊ መዝገብ ወይም የዳታ መጠን ከሆነው የደረጃ ምርጫዎች፣ እነዚህን ነገር ሁሉ ለትክክለኛ ስራ በአቅራቢያ ይታያል፡፡ በዚህ ፕሮግራም፣ ይህ ጉዳይ ቋንቋዎችን በመምረጥ በአስባታዊ መተላለፊያ መሆኑን እናስታውቃለን፡፡ የNLP ስራ ፈተና በመጠቀም ሞዴላዎቻችን በተለየ ብሔራዊ ደረጃዎች ላይ ከመለወጥ የበለጠ ቋንቋዎችን እንዲያሳያል እናስታውቃለን፡፡Abstract
أصبح النقل عبر اللغات ، حيث يتم استخدام لغة نقل عالية الموارد لتحسين دقة لغة مهمة منخفضة الموارد ، الآن أداة لا تقدر بثمن لتحسين أداء معالجة اللغة الطبيعية (NLP) في اللغات منخفضة الموارد. ومع ذلك ، بالنظر إلى لغة مهمة معينة ، ليس من الواضح أي لغة سيتم النقل منها ، والاستراتيجية القياسية هي اختيار اللغات بناءً على معايير مخصصة ، وعادة ما يكون ذلك من حدس المجرب. نظرًا لأن عددًا كبيرًا من الميزات يساهم في نجاح النقل عبر اللغات (بما في ذلك تشابه النشوء والتطور ، أو الخصائص النمطية ، أو التداخل المعجمي ، أو حجم البيانات المتاحة) ، نادرًا ما يأخذ المجرب الأكثر استنارة في الاعتبار كل هذه العوامل للمهمة المحددة في متناول اليد. في هذه الورقة ، نعتبر هذه المهمة المتمثلة في التحديد التلقائي للغات النقل المثلى كمشكلة ترتيب ، وبناء نماذج تأخذ في الاعتبار الميزات المذكورة أعلاه لإجراء هذا التوقع. في التجارب التي أجريت على مهام البرمجة اللغوية العصبية التمثيلية ، نوضح أن نموذجنا يتنبأ بلغات نقل جيدة أفضل بكثير من خطوط الأساس المخصصة التي تأخذ في الاعتبار الميزات الفردية في عزلة ، وتجمع رؤى حول الميزات الأكثر إفادة لكل مهام معالجة لغوية عصبية مختلفة ، والتي قد تفيد التحديد المخصص في المستقبل حتى بدون استخدام طريقتنا.Abstract
Təbiətli dil işləməsi (NLP) ilə düşük ressurs dillərində təhsil işləməsi (təbiətli dil işləməsi (NLP) təhsil dillərini yaxşılaşdırmaq üçün çox yüksək ressurs işləməsi dili ilə istifadə edilir. Ancaq bəzi işin dilinə görə, hansı dildən istifadə ediləcəyini a çıq deyil, və standart strateji ad hoc kriteriyyətlərinə dayanan dilləri seçməkdir, genellikle təcrübəçinin intuitsiyası. Ən çox xüsusiyyətlər, hətta ən aydınlaşdırılmış təcrübəcüsü bu təcrübəcüsü müəyyən edilən təcrübəcüsünün başarısına kömək edir. Bu kağızda, bu işləri avtomatik olaraq optimal transfer dillərini dərəcə problemi kimi seçmək və əvvəlkilərin tədbirlərini təqdim etmək üçün düşünən modellər inşa edirik. NLP vəzifələrində müəyyən edilən təcrübələrdə modellərimizin ad hoc baz çizgələrindən daha yaxşı təcrübə dillərini təcrübə edir, yalnız təcrübələrdə təcrübə edir və hər fərqli NLP vəzifələrindən ən çox informativ olanları təcrübə edir. Bu, yolumuzdan istifadə edilmədən də gələcək ad hoc seçməsini bildirir.Abstract
Междуезичният трансфер, при който езикът за трансфер с висок ресурс се използва за подобряване на точността на езика на задачите с нисък ресурс, сега е безценен инструмент за подобряване на ефективността на обработка на естествения език (НЛП) на езици с нисък ресурс. Въпреки това, предвид определен език на задачата, не е ясно от кой език да се прехвърли и стандартната стратегия е да се изберат езици въз основа на ad hoc критерии, обикновено интуицията на експериментиращия. Тъй като голям брой характеристики допринасят за успеха на междуезичния трансфер (включително филогенетична прилика, типологични свойства, лексикално припокриване или размер на наличните данни), дори и най-просветленият експериментатор рядко разглежда всички тези фактори за конкретната задача. В тази статия разглеждаме задачата за автоматично избиране на оптимални езици за трансфер като проблем за класиране и изграждане на модели, които отчитат гореспоменатите функции за извършване на тази прогноза. В експерименти с представителни задачи за НЛП ние демонстрираме, че нашият модел прогнозира добри трансферни езици много по-добре от базовите линии, като се вземат предвид отделни функции самостоятелно, и събираме прозрения за това кои функции са най-информативни за всяка отделна задача от НЛП, което може да информира бъдещия избор дори и без използването на нашия метод.Abstract
ক্রস-ভাষার পরিবর্তন, যেখানে একটি উচ্চ সম্পদ পরিবর্তন ভাষা ব্যবহার করা হয় নিম্নলিখিত সম্পদের সঠিকভাবে উন্নত করার জন্য, এখন একটি প্রাকৃতিক ভাষার প্রক্রিয়ার (এনএলপি) প্রক্রিয়া তবে একটি বিশেষ কাজের ভাষা দিয়ে এটা পরিষ্কার নয় যে কোন ভাষা থেকে সরিয়ে নেওয়ার জন্য পরিষ্কার করা হবে এবং স্বাভাবিক ক্রিয়ার উপর ভিত্তিক ভাষায় ভাষ যেহেতু বেশ কয়েকটি বৈশিষ্ট্য বৈশিষ্ট্যের সংখ্যা ক্ষেত্রে (যার মধ্যে ফাইলোজেনেটিক সমতা, টাইবোলিকাল বৈশিষ্ট্য, লেক্সিক্সিয়াল বা বিদ্যমান তথ্যের সাথে বিনিম এই কাগজটিতে আমরা স্বয়ংক্রিয়ভাবে ভাষাগুলো স্বয়ংক্রিয়ভাবে বেছে নিয়ে যাচ্ছি একটি রেঙ্কিং সমস্যা হিসেবে, আর মডেল তৈরি করি যা আগের উল এনএলপি কাজের প্রতিনিধিত্বের পরীক্ষায় আমরা প্রমাণ করি যে আমাদের মডেল ভাষাকে বিভিন্ন বিভিন্ন ভাষার চেয়ে ভালো পরিবর্তনের ভাষার ভবিষ্যদ্বাণী করেছি বিভিন্ন ভিন্ন ভিন্ন ভিন্ন ভিন্ন ভিAbstract
Cross-lingual transfer, where a high-resource transfer language is used to improve the accuracy of a low-resource task language, is now a invaluable tool for improving performance of natural language processing (NLP) on low-resource languages. ཡིན་ནའང་། བྱ་འགུལ་གྱི་སྐད་ཡིག་དམིགས་བསལ་བྱས་པ་ཞིག་ནི་སྐད་ཡིག་གནས་སྟངས་གང་ཞིག་ལས་སྐྱེལ་འདྲེན་བྱེད་དགོས་མིན་འདུག། རྒྱུན གཙོ་ཆེ་ཤོས་ཀྱི་ཆེ་ཆུང་དེ་ནས་སྐད་ཡིག་ཆ་འདིའི་གྲུབ་ཚད་དང་མཐུན་སྐྱེས་ཚུལ་ལྡན་བྱེད་བཞིན་ཡོད། ང་ཚོས་ཤོག་བྱང་འདིའི་ནང་དུ་བྱ་འགུལ་འདི་རང་འགུལ་གྱིས་གནས་སྐྱོད་ཀྱི་སྐད་རིགས་སྐྱེལ་འདྲེན་པ་ལ་རང་འགུལ་གྱིས་འཛིན་སྤྱོད་མཁན་ In experiments on representative NLP tasks, we demonstrate that our model predicts good transfer languages much better than ad hoc baselines considering single features in isolation, and glean insights on what features are most informative for each different NLP tasks, which may inform future ad hoc selection even without use of our method.Abstract
Prebacivanje kroz jezik, gdje se koristi jezik prebacivanja visokih resursa kako bi se poboljšala preciznost jezika niskih resursa, sada je neprocjenjiv alat za poboljšanje učinka prirodnog obrade jezika (NLP) na jezicima niskih resursa. Međutim, s obzirom na određeni jezik zadatka, nije jasno od kojeg jezika treba prenijeti, a standardna strategija je izabrati jezike na osnovu ad hoc kriterija, obično intuicija eksperimentatora. Budući da veliki broj karakteristika doprinose uspjehu preko jezika prenošenja (uključujući filogenetičku sličnost, tipološke vlasti, leksički preklapanje ili veličinu dostupnih podataka), čak i najprosvjetljeniji eksperimenter rijetko smatra sve te faktore za određeni zadatak. U ovom papiru smatramo zadatak automatskog odabranja optimalnih jezika prenošenja kao problem u redovima i izgradnja modela koji smatraju predviđenim karakteristikama kako bi izvršili ovu predviđanje. U eksperimentima o reprezentativnim zadacima NLP, mi pokazujemo da naš model predviđa dobre prijenosne jezike mnogo bolje nego ad hoc bazne linije s obzirom na jedine funkcije u izolaciji, i glean uvid o tome kakve su karakteristike najinformativnije za svaki različiti zadatak NLP-a, koji bi mogli obavijestiti budući ad hoc izbor čak i bez upotrebe našeg metoda.Abstract
La transfer ència translingüística, on es fa servir un llenguatge de transferència de recursos elevats per millorar la precisió d'un llenguatge de tasques de baix recursos, és ara una eina inestimable per millorar el rendiment del processament natural de llenguatges (NLP) en llenguatges de baix recursos. However, given a particular task language, it is not clear which language to transfer from, and the standard strategy is to select languages based on ad hoc criteria, usually the intuition of the experimenter. Com que un gran nombre de característiques contribueixen a l'èxit de la transfer ència translingüística (incloent la similitud filogenètica, les propietats tipològiques, la sobreposió lèxica o la mida de les dades disponibles), fins i tot l'experimentador més esclaregut rarament considera tots aquests factors per a la tasca en particular. En aquest paper, considerem aquesta tasca de seleccionar automàticament les llengües de transfer ència com un problem a de classificació, i construir models que consideren les característiques mencionades per fer aquesta predicció. En experiments sobre tasques representatives del NLP, demostram que el nostre model prediu bones llengües de transfer ència molt millors que les línies de base ad hoc considerant característiques senzilles en aïllament, i obtenim una idea de quines característiques són més informatives per cada tasca del NLP, que poden informar la selecció ad hoc futura fins i tot sense utilitzar el nostre mètode.Abstract
Přenos mezi jazyky, kde se jazyk s vysokými zdroji používá ke zlepšení přesnosti jazyka úloh s nízkými zdroji, je nyní neocenitelným nástrojem pro zlepšení výkonu zpracování přirozeného jazyka (NLP) u jazyků s nízkými zdroji. Nicméně vzhledem k konkrétnímu jazyku úkolu není jasné, z jakého jazyka se převádí, a standardní strategií je vybírat jazyky na základě ad hoc kritérií, obvykle intuice experimentátora. Vzhledem k tomu, že velké množství funkcí přispívá k úspěchu přenosu mezi jazyky (včetně fylogenetické podobnosti, typologických vlastností, lexikálního překrývání nebo velikosti dostupných dat), dokonce i ten nejosvícenější experimentátor zřídka zvažuje všechny tyto faktory pro konkrétní úkol. V tomto článku považujeme tento úkol automatického výběru optimálních přenosových jazyků za problém hodnocení a sestavujeme modely, které zohlední výše uvedené funkce pro provedení této predikce. V experimentech na reprezentativních NLP úlohách demonstrujeme, že náš model předpovídá dobré přenosové jazyky mnohem lépe než ad hoc základní linky s ohledem na jednotlivé funkce izolovaně, a získáváme poznatky o tom, které funkce jsou pro každou různou NLP úlohu nejvíce informativní, což může informovat budoucí ad hoc výběr i bez použití naší metody.Abstract
Tværsproget overførsel, hvor et overførselssprog med høj ressource anvendes til at forbedre nøjagtigheden af et opgavesprog med lav ressource, er nu et uvurderligt værktøj til at forbedre ydeevnen af behandling af natursprog (NLP) på sprog med lav ressource. I betragtning af et bestemt opgavesprog er det imidlertid ikke klart, hvilket sprog der skal overføres fra, og standardstrategien er at vælge sprog baseret på ad hoc kriterier, normalt forsøgsmandens intuition. Da en lang række funktioner bidrager til succesen af tværsproget overførsel (herunder fylogenetisk lighed, typologiske egenskaber, leksikalsk overlapning eller størrelse af tilgængelige data), selv den mest oplyste eksperimenter sjældent overvejer alle disse faktorer for den pågældende opgave. I denne artikel betragter vi denne opgave med automatisk at vælge optimale overførselssprog som et rangeringsproblem og opbygge modeller, der overvejer ovennævnte funktioner til at udføre denne forudsigelse. I eksperimenter med repræsentative NLP-opgaver viser vi, at vores model forudsiger gode overførselssprog langt bedre end ad hoc-basislinjer, der betragter enkelte funktioner isoleret, og indhenter indsigt i, hvilke funktioner der er mest informative for hver enkelt NLP-opgave, hvilket kan give anledning til fremtidig ad hoc-udvælgelse selv uden brug af vores metode.Abstract
Der sprachübergreifende Transfer, bei dem eine ressourcenintensive Transfersprache verwendet wird, um die Genauigkeit einer ressourcenarmen Aufgabensprache zu verbessern, ist jetzt ein unschätzbares Werkzeug zur Verbesserung der Leistung der Verarbeitung natürlicher Sprache (NLP) auf ressourcenarmen Sprachen. Angesichts einer bestimmten Aufgabensprache ist jedoch nicht klar, aus welcher Sprache transferiert werden soll, und die Standardstrategie besteht darin, Sprachen basierend auf Ad-hoc-Kriterien auszuwählen, in der Regel der Intuition des Experimentators. Da eine Vielzahl von Merkmalen zum Erfolg des translingualen Transfers beitragen (einschließlich phylogenetischer Ähnlichkeit, typologischen Eigenschaften, lexikalischer Überlappung oder Größe verfügbarer Daten), berücksichtigt selbst der aufgeklärteste Experimentator selten all diese Faktoren für die jeweilige Aufgabe. In diesem Beitrag betrachten wir diese Aufgabe der automatischen Auswahl optimaler Transfersprachen als Rankingproblem und bauen Modelle, die die oben genannten Eigenschaften berücksichtigen, um diese Vorhersage durchzuführen. In Experimenten an repräsentativen NLP-Aufgaben zeigen wir, dass unser Modell gute Transfersprachen viel besser vorhersagt als Ad-hoc-Baselines, die einzelne Features isoliert betrachten, und gewinnen Erkenntnisse darüber, welche Features für die verschiedenen NLP-Aufgaben am informativsten sind, was zukünftige Ad-hoc-Auswahl auch ohne Verwendung unserer Methode beeinflussen kann.Abstract
Η διασυνοριακή μεταφορά, όπου χρησιμοποιείται μια γλώσσα μεταφοράς υψηλών πόρων για τη βελτίωση της ακρίβειας μιας γλώσσας εργασίας χαμηλής περιεκτικότητας σε πόρους, αποτελεί πλέον ένα ανεκτίμητο εργαλείο για τη βελτίωση της απόδοσης της επεξεργασίας φυσικής γλώσσας σε γλώσσες χαμηλής περιεκτικότητας σε πόρους. Ωστόσο, δεδομένης μιας συγκεκριμένης γλώσσας εργασίας, δεν είναι σαφές από ποια γλώσσα θα μεταφερθεί, και η τυποποιημένη στρατηγική είναι η επιλογή γλωσσών βάσει ad hoc κριτηρίων, συνήθως της διαίσθησης του πειραματιστή. Δεδομένου ότι ένας μεγάλος αριθμός χαρακτηριστικών συμβάλλουν στην επιτυχία της διασυνοριακής μεταφοράς (συμπεριλαμβανομένης της φυλογενικής ομοιότητας, των τυπολογικών ιδιοτήτων, της λεξικής επικάλυψης ή του μεγέθους των διαθέσιμων δεδομένων), ακόμη και ο πιο φωτισμένος πειραματιστής σπάνια εξετάζει όλους αυτούς τους παράγοντες για το συγκεκριμένο έργο. Στην παρούσα εργασία, θεωρούμε αυτό το καθήκον της αυτόματης επιλογής βέλτιστων γλωσσών μεταφοράς ως πρόβλημα κατάταξης και κατασκευάζουμε μοντέλα που λαμβάνουν υπόψη τα προαναφερθέντα χαρακτηριστικά για την εκτέλεση αυτής της πρόβλεψης. Σε πειράματα σε αντιπροσωπευτικές εργασίες καταδεικνύουμε ότι το μοντέλο μας προβλέπει καλές γλώσσες μεταφοράς πολύ καλύτερα από τις ad hoc γραμμές βάσης λαμβάνοντας μεμονωμένα χαρακτηριστικά μεμονωμένα, και συγκεντρώνουμε πληροφορίες σχετικά με τα χαρακτηριστικά που είναι πιο ενημερωτικά για κάθε διαφορετικές εργασίες οι οποίες μπορεί να ενημερώσουν τη μελλοντική επιλογή ακόμη και χωρίς χρήση της μεθόδου μας.Abstract
La transferencia multilingüe, en la que se utiliza un lenguaje de transferencia de muchos recursos para mejorar la precisión de un lenguaje de tareas de pocos recursos, es ahora una herramienta invaluable para mejorar el rendimiento del procesamiento del lenguaje natural (NLP) en idiomas de bajos recursos. Sin embargo, dado un lenguaje de tareas en particular, no está claro desde qué idioma transferir, y la estrategia estándar es seleccionar idiomas según criterios ad hoc, generalmente la intuición del experimentador. Dado que un gran número de características contribuyen al éxito de la transferencia interlingüística (incluida la similitud filogenética, las propiedades tipológicas, la superposición léxica o el tamaño de los datos disponibles), incluso el experimentador más inteligente rara vez considera todos estos factores para la tarea particular en cuestión. En este artículo, consideramos esta tarea de seleccionar automáticamente los idiomas de transferencia óptimos como un problema de clasificación, y creamos modelos que tienen en cuenta las características antes mencionadas para realizar esta predicción. En experimentos sobre tareas representativas de PNL, demostramos que nuestro modelo predice los buenos lenguajes de transferencia mucho mejor que las líneas de base ad hoc, considerando características individuales de forma aislada, y obtenemos información sobre qué funciones son más informativas para cada tarea de PNL diferente, lo que puede informar sobre futuras selecciones ad hoc. incluso sin usar nuestro método.Abstract
Keeleülene ülekanne, kus suure ressursiga ülekandekeelt kasutatakse vähese ressursiga ülesandekeele täpsuse parandamiseks, on nüüd hindamatu vahend looduskeele töötlemise tulemuslikkuse parandamiseks vähese ressursiga keeltes. Kuid konkreetset ülesandekeelt arvestades ei ole selge, millisest keelest üle minna, ning standardstrateegia on valida keeled ad hoc kriteeriumide alusel, tavaliselt eksperimenteerija intuitsiooni alusel. Kuna paljud omadused aitavad kaasa keeleülese ülekande edule (sealhulgas fülogeneetiline sarnasus, tüpoloogilised omadused, leksikaalne kattuvus või olemasolevate andmete suurus), kaalub isegi kõige valgustatum katsetaja harva kõiki neid tegureid konkreetse ülesande puhul. Käesolevas dokumendis käsitleme seda ülesannet valida automaatselt optimaalsed ülekandekeeled kui järjestusprobleem ja ehitada mudelid, mis arvestavad eespool nimetatud funktsioone selle prognoosi teostamiseks. Tüüpiliste NLP ülesannetega tehtavate katsete käigus näitame, et meie mudel prognoosib häid ülekandekeeli palju paremini kui ad hoc lähtejooned, arvestades üksikuid funktsioone eraldi, ning saame ülevaate sellest, millised funktsioonid on kõige informatiivsemad iga erineva NLP ülesande jaoks, mis võivad tulevikus teavitada ka meie meetodit kasutamata.Abstract
انتقال زبانهای متوسط، جایی که زبان انتقال منبع بالا برای بهبود دادن دقیق زبان کاری کم منبع استفاده میشود، ابزار بیارزش برای بهبود کردن عملکرد پردازش زبان طبیعی (NLP) در زبانهای کم منبع است. ولی با توجه به زبان یک کار خاص، مشخص نیست که از کدام زبان انتقال دهد، و استراتژی استاندارد زبانها را بر اساس مقدارهای ad hoc انتخاب کنید، معمولاً مشخص آزمایشگر است. از آنجایی که تعداد زیادی از ویژگیها به موفقیت انتقال متوسط زبان (شامل شبیه فیلوژنتیک، ویژگیهای تایپولوژیکی، تغییرزدن زبانشناسی، یا اندازه دادههای موجود) حاصل میکنند، حتی بزرگترین آزمایشگر روشنترین آزمایشگر کمتر این fakt در این کاغذ، ما این کار را به طور خودکار انتخاب کردن زبانهای انتقال optimal به عنوان یک مشکل درجه برگزیده می کنیم و مدل ساخته می کنیم که ویژه های پیشبینی را برای انجام این پیشبینی میبینیم. در آزمایشات روی کارهای نماینده NLP، ما نشان می دهیم که مدل ما زبان های انتقال خوب را بهتر از خطوط های بنیادی ad hoc پیش بینی می کند که با توجه به ویژه های واحدی در تنهایی، و مشاهده می کنند که ویژه های بیشترین اطلاعات برای هر کار NLP متفاوتی هستند، که می تواند انتقال ad hoc آینده را حتی بدون استفاده از روش ما اطAbstract
Kielten välinen siirto, jossa korkean resurssin siirtokieltä käytetään vähäresurssisen tehtäväkielen tarkkuuden parantamiseen, on nyt korvaamaton työkalu luonnollisen kielen käsittelyn (NLP) suorituskyvyn parantamiseen vähäresurssisilla kielillä. Kun otetaan huomioon tietty tehtäväkieli, ei ole kuitenkaan selvää, mistä kielestä siirrytään, ja vakiostrategiana on valita kielet ad hoc -kriteerien perusteella, yleensä kokeilijan intuition perusteella. Koska suuri määrä ominaisuuksia edistää monikielisen siirron onnistumista (mukaan lukien fylogeeninen samankaltaisuus, typologiset ominaisuudet, leksikaalinen päällekkäisyys tai saatavilla olevan tiedon koko), jopa kaikkein valistunut koettaja harvoin harkitsee kaikkia näitä tekijöitä käsiteltävänä olevassa tehtävässä. Tässä artikkelissa pidämme tehtäväämme valita automaattisesti optimaaliset siirtokielet ranking-ongelmana ja rakentaa malleja, jotka huomioivat edellä mainitut ominaisuudet tämän ennusteen suorittamiseksi. Edustavien NLP-tehtävien kokeiluissa osoitamme, että mallimme ennustaa hyviä siirtokieliä paljon paremmin kuin yksittäiset ominaisuudet erikseen huomioiden, ja keräämme tietoa siitä, mitkä ominaisuudet ovat informatiivisimpia kullekin NLP-tehtävälle, mikä voi olla tulevaisuuden ad hoc -valintaa myös ilman menetelmäämme.Abstract
Le transfert interlinguistique, dans lequel un langage de transfert à ressources élevées est utilisé pour améliorer la précision d'un langage de travail à faibles ressources, est désormais un outil précieux pour améliorer les performances du traitement du langage naturel (NLP) sur les langues à faibles ressources. Cependant, compte tenu d'une langue de tâche particulière, il n'est pas clair de quelle langue transférer, et la stratégie standard consiste à sélectionner les langues en fonction de critères ad hoc, généralement selon l'intuition de l'expérimentateur. Étant donné qu'un grand nombre de caractéristiques contribuent au succès du transfert interlinguistique (y compris la similitude phylogénétique, les propriétés typologiques, le chevauchement lexical ou la taille des données disponibles), même l'expérimentateur le plus éclairé considère rarement tous ces facteurs pour la tâche particulière à accomplir. Dans cet article, nous considérons cette tâche de sélection automatique des langues de transfert optimales comme un problème de classement, et nous créons des modèles qui tiennent compte des fonctionnalités mentionnées ci-dessus pour effectuer cette prédiction. Dans des expériences sur des tâches de PNL représentatives, nous démontrons que notre modèle prédit de bons langages de transfert bien mieux que les lignes de base ad hoc en tenant compte de caractéristiques uniques isolées, et nous glanons des informations sur les fonctionnalités les plus informatives pour chaque tâche de PNL différente, ce qui peut éclairer la sélection ad hoc future même sans utiliser notre méthode.Abstract
Is uirlis fhíorluachmhar anois é aistriú trasteangach, ina n-úsáidtear teanga aistrithe ard-acmhainne chun cruinneas tasctheanga íseal-acmhainne a fheabhsú, chun feidhmíocht próiseála teanga nádúrtha (NLP) ar theangacha íseal-acmhainne a fheabhsú. I bhfianaise thasctheanga ar leith, áfach, ní léir cén teanga le haistriú uaithi, agus is í an straitéis chaighdeánach ná teangacha a roghnú bunaithe ar chritéir ad hoc, de ghnáth intleacht an turgnaimh. Ós rud é go gcuireann líon mór gnéithe le rath an aistrithe thrasteangaigh (lena n-áirítear cosúlacht fhileigineach, airíonna tíopeolaíochta, forluí foclóireachta, nó méid na sonraí atá ar fáil), is annamh a mheasann an turgnamhoir is suntasaí na fachtóirí seo go léir don tasc áirithe atá ar fáil. Sa pháipéar seo, breithnímid ar an tasc seo maidir le teangacha aistrithe barrmhaithe a roghnú go huathoibríoch mar fhadhb rangú, agus samhlacha a thógáil a bhreithníonn na gnéithe thuasluaite chun an tuar seo a dhéanamh. I dturgnaimh ar thascanna ionadaíocha NLP, léirímid go ndéanann ár múnla dea-aistrithe teangacha a thuar i bhfad níos fearr ná na bunlínte ad hoc ag smaoineamh ar ghnéithe aonair ina n-aonar, agus léargais a fháil ar na gnéithe is faisnéisí do gach tascanna NLP éagsúla, a d'fhéadfadh eolas a chur ar fáil do roghnú ad hoc sa todhchaí. fiú gan úsáid a bhaint as ár modh.Abstract
Transmit-harshen na-nau'in, inda aka yi amfani da harshen mai maras sarrafa zuwa gyãra ga tsari na harshen aiki na ƙasan-resource, yanzu yana da wata alama mai inganci wa improve aikin harshen na asalin (NLP) kan lugha na ƙasan-resource. A lokacin da aka bãyar da harshen wani ƙayyade aikin aiki, bai zama bayani ba da wanne lugha za'a shige shi daga, kuma yana da kimar da aka daidaita shi don a zãɓi harsunan a kan takardar ad hoc, ko da ɗabi'a, ma'anar kalmar mai jarraba. Since a large number of features contribute to the success of cross-lingual transfer (including phylogenetic similarity, typological properties, lexical overlap, or size of available data), even the most enlightened experimenter rarely considers all these factors for the particular task at hand. Ga wannan takardan, munã ƙaddara wannan aikin da za'a zãɓi shiryoyin ayukan ayuka farat ɗaya kamar wata matabbaci na danganta, kuma mu sami misãlai wanda ke yi bincike da tsarin da aka faɗa a a gabani don su cika wannan basĩri. Daga jarrabo masu gabatar da aikin NLP, tuna nuna cẽwa misalinmu yana bayani ga transfer lugha masu alhẽri ko kuwa mafi alhẽri daga fassarar ad hoc, kuma idan an yi tunãni ga masu hushi guda da wuri, kuma mu yi sauna da gannai a kan abin da haske mafi information ne ga duk aikin NLP, wanda yana iya gaya wa zaɓen bayani na nan gaba ko kuma bã ya amfani da hanyoyinmu.Abstract
העברה דרך שפתיים, שבה שפת העברה של משאבים גבוהים משתמשת כדי לשפר את מדויקתו של שפת משאבים נמוכות, היא כעת כלי חסר ערך לשיפור ביצועים של עיבוד שפת טבעית (NLP) על שפות משאבים נמוכות. עם זאת, בהתחשב בשפה משימה מסויימת, לא ברור מאיזו שפה להעביר, והאסטרטגיה הסטנדרטית היא לבחור שפות מבוססות על קריטורים ad hoc, בדרך כלל האינטואיציה של הניסוין. מכיוון שמספר גדול של תכונות תורמים להצלחה של העברה בין שפות (כולל דמיון פילוגנטי, תכונות טיפולוגיות, התקפלות לקסית, או גודל של נתונים זמינים), אפילו הניסוי המאור ביותר לעיתים נדירות שוקל את כל הגורמים האלה למשימה המיוחדת הנוכחית. בעיתון הזה, אנו מחשיבים את המשימה הזאת של לבחור אוטומטי שפות העברה כבעיה מדרגה, ולבנות דוגמנים ששוקלים את המאפיינים הללו על מנת לבצע את החזוי הזה. בניסויים על משימות נציגיות של NLP, אנו מראים שהדוגמא שלנו חושף שפות העברה טובות הרבה יותר טובות מאשר קווי הבסיס ad hoc בהתחשב בכישורים בודדים בבידוד, ולגלות הבנות על איזה תכונות הם הכי מידעיים לכל משימות שונות של NLP, אשר עלולים ליידע את הבחירה ad hoc עתידית אפילו בלי להשתמש בשAbstract
क्रॉस-लिंगुअल ट्रांसफर, जहां कम-संसाधन कार्य भाषा की सटीकता में सुधार करने के लिए एक उच्च-संसाधन हस्तांतरण भाषा का उपयोग किया जाता है, अब कम-संसाधन भाषाओं पर प्राकृतिक भाषा प्रसंस्करण (एनएलपी) के प्रदर्शन में सुधार के लिए एक अमूल्य उपकरण है। हालांकि, एक विशेष कार्य भाषा को देखते हुए, यह स्पष्ट नहीं है कि किस भाषा से स्थानांतरित करना है, और मानक रणनीति तदर्थ मानदंडों के आधार पर भाषाओं का चयन करना है, आमतौर पर प्रयोगकर्ता का अंतर्ज्ञान। चूंकि बड़ी संख्या में विशेषताएं क्रॉस-लिंगुअल ट्रांसफर की सफलता में योगदान करती हैं (जिसमें फाइलोजेनेटिक समानता, टाइपोलॉजिकल गुण, लेक्सिकल ओवरलैप, या उपलब्ध डेटा का आकार शामिल है), यहां तक कि सबसे प्रबुद्ध प्रयोगकर्ता शायद ही कभी इन सभी कारकों को हाथ में विशेष कार्य के लिए मानता है। इस पेपर में, हम रैंकिंग समस्या के रूप में इष्टतम स्थानांतरण भाषाओं को स्वचालित रूप से चुनने के इस कार्य पर विचार करते हैं, और मॉडल का निर्माण करते हैं जो इस भविष्यवाणी को करने के लिए उपरोक्त सुविधाओं पर विचार करते हैं। प्रतिनिधि एनएलपी कार्यों पर प्रयोगों में, हम प्रदर्शित करते हैं कि हमारा मॉडल अलगाव में एकल सुविधाओं पर विचार करने वाले तदर्थ बेसलाइन की तुलना में अच्छी हस्तांतरण भाषाओं की भविष्यवाणी करता है, और प्रत्येक अलग-अलग एनएलपी कार्यों के लिए कौन सी विशेषताएं सबसे अधिक जानकारीपूर्ण हैं, जो हमारी विधि के उपयोग के बिना भी भविष्य के तदर्थ चयन को सूचित कर सकती हैं।Abstract
Prebacivanje kroz jezik, gdje se koristi jezik prebacivanja visokih resursa kako bi se poboljšala preciznost jezika niskih resursa, sada je neprocjenjiv alat za poboljšanje učinka prirodnog obrade jezika (NLP) na jezicima niskih resursa. Međutim, s obzirom na određeni jezik zadatka, nije jasno od kojeg jezika treba prenijeti, a standardna strategija je odabrati jezike na osnovu ad hoc kriterija, obično intuicija eksperimentatora. Budući da veliki broj karakteristika doprinose uspjehu preko jezika prenošenja (uključujući filogenetičku sličnost, tipološke vlasti, leksički preklapanje ili veličinu dostupnih podataka), čak i najprosvjetljeniji eksperimenter rijetko smatra sve te faktore za određeni zadatak. U ovom papiru smatramo ovaj zadatak automatskog odabranja optimalnih jezika prenošenja kao problem u redovima i izgradnja modela koji smatraju predviđenim karakteristikama kako bi izvršili ovu predviđanje. U eksperimentima o predstavnicima NLP-a, pokazujemo da naš model predviđa dobre prijenosne jezike mnogo bolje nego ad hoc osnovne linije s obzirom na jedine funkcije u izolaciji, i glean uvid o kakvim su karakteristikama najinformativnijim za svaki različiti zadatak NLP-a, koji bi mogli obavijestiti budući ad hoc izbor čak i bez upotrebe našeg metoda.Abstract
A többnyelvű transzfer, ahol egy nagy erőforrású transzfer nyelvet használnak az alacsony erőforrású feladatnyelv pontosságának javítására, most felbecsülhetetlen eszköz a természetes nyelvi feldolgozás (NLP) teljesítményének javítására alacsony erőforrású nyelveken. Egy adott feladatnyelv miatt azonban nem világos, hogy melyik nyelvről kell átültetni, és a standard stratégia az, hogy ad hoc kritériumok alapján válasszuk ki a nyelveket, általában a kísérletező intuíciója alapján. Mivel számos jellemző hozzájárul a nyelvek közötti transzfer sikeréhez (beleértve a filogenetikai hasonlóságot, tipológiai tulajdonságokat, lexikális átfedést vagy a rendelkezésre álló adatok méretét), még a legmegvilágosodottabb kísérletező is ritkán veszi figyelembe ezeket a tényezőket az adott feladathoz. Ebben a tanulmányban rangsorolási problémának tekintjük az optimális transzfer nyelvek automatikus kiválasztását, és olyan modelleket készítünk, amelyek figyelembe veszik a fent említett funkciókat a jóslat végrehajtásához. Reprezentatív NLP feladatokkal végzett kísérletek során bebizonyítjuk, hogy modellünk sokkal jobban előrejelzi a jó transzfer nyelveket, mint az ad hoc alapértékeket, figyelembe véve az egyes funkciókat, és betekintést gyűjtünk arról, hogy mely funkciók a leginformációsabbak minden egyes NLP feladat esetében, ami a jövőbeni ad hoc kiválasztást még a módszerünk használata nélkül is tájékoztathatja.Abstract
Երկրաժշտական փոխանցումը, որտեղ բարձր ռեսուրսների փոխանցման լեզուն օգտագործվում է ցածր ռեսուրսների խնդիրների լեզու ճշգրիտության բարելավման համար, հիմա անգնահատելի գործիք է ցածր ռեսուրսների լեզուների բնական վերլուծության (ՆԼՊ) արդյունքների բարելավ Այնուամենայնիվ, հատուկ խնդիր ունեցող լեզուն հաշվի առնելով, պարզ չէ, թե որից լեզուն պետք է փոխանցվել, և ստանդարտ ռազմավարությունն այն է, որ ընտրենք լեզուներ, որոնք հիմնված են հատկապես հատուկ քննությունների վրա, սովորաբար փորձա Քանի որ շատ հատկություններ են ներդրում լեզվային փոխանցման հաջողության վրա (ներառյալ ֆիլոգենետիկ նմանությունը, տիպոլոգիական հատկությունները, լեքսիկական փոխանցումը կամ հասանելի տվյալների չափը), նույնիսկ ամենալուսավոր փորձարկողը հազվադեպ է հաշվի առնում այս բոլոր գործոնները հատուկ Այս թղթի մեջ մենք ինքնաբերաբար ընտրում ենք օպտիմալ լեզուներ որպես դասակարգման խնդիր և կառուցում ենք մոդելներ, որոնք վերաբերում են նախկինում գտնվող հատկություններին այս կանխատեսումը կատարելու համար: ՆԼՊ-ի ներկայացուցիչ առաջադրանքների փորձարկումներում մենք ցույց ենք տալիս, որ մեր մոդելը կանխատեսում է լավ լեզուներ փոխանցումից շատ ավելի լավ, քան հատուկ հիմքերը, որոնք հաշվի առնում են մեկ հատկություն առանձին առանձին առանձին հատկություններ, և պարզում են, թե ինչ հատկություններ են ամենատեղեկատվական յուրաAbstract
Transfer saling bahasa, di mana bahasa transfer sumber daya tinggi digunakan untuk meningkatkan akurasi bahasa tugas sumber daya rendah, kini adalah alat yang tidak berharga untuk meningkatkan prestasi proses bahasa alam (NLP) pada bahasa sumber daya rendah. Namun, mengingat bahasa tugas tertentu, tidak jelas bahasa mana untuk dipindahkan dari, dan strategi standar adalah memilih bahasa berdasarkan kriteria ad hoc, biasanya intuisi eksperimen. Karena sejumlah besar ciri-ciri berkontribusi ke sukses transfer saling bahasa (termasuk kesamaan filogenetik, ciri-ciri tipologi, overlap lexik, atau ukuran data yang tersedia), bahkan eksperimen yang paling terang jarang mempertimbangkan semua faktor ini untuk tugas tertentu yang ada. Dalam kertas ini, kami mempertimbangkan tugas ini untuk memilih secara otomatis bahasa transfer optimal sebagai masalah peringkat, dan membangun model yang mempertimbangkan ciri-ciri terdahulu untuk melakukan prediksi ini. Dalam eksperimen pada tugas yang mewakili NLP, kami menunjukkan bahwa model kami memprediksi bahasa transfer yang baik jauh lebih baik daripada garis dasar ad hoc mempertimbangkan fitur tunggal dalam isolasi, dan mencari tahu apa fitur yang paling informatif untuk setiap tugas NLP yang berbeda, yang dapat memberitahu seleksi ad hoc masa depan bahkan tanpa menggunakan metode kami.Abstract
Il trasferimento multilingue, in cui un linguaggio di trasferimento ad alte risorse viene utilizzato per migliorare l'accuratezza di un linguaggio di attività a basso contenuto di risorse, è ora uno strumento prezioso per migliorare le prestazioni dell'elaborazione del linguaggio naturale (PNL) su linguaggi a basso contenuto di risorse. Tuttavia, dato un particolare linguaggio di compito, non è chiaro da quale lingua trasferire, e la strategia standard è quella di selezionare le lingue in base a criteri ad hoc, solitamente l'intuizione dello sperimentatore. Poiché un gran numero di caratteristiche contribuiscono al successo del trasferimento cross-lingual (tra cui somiglianza filogenetica, proprietà tipologiche, sovrapposizione lessicale o dimensione dei dati disponibili), anche lo sperimentatore più illuminato raramente considera tutti questi fattori per il particolare compito a portata di mano. In questo articolo, consideriamo questo compito di selezionare automaticamente le lingue di trasferimento ottimali come un problema di ranking, e costruire modelli che considerino le caratteristiche di cui sopra per eseguire questa previsione. In esperimenti su attività rappresentative di PNL, dimostriamo che il nostro modello prevede un buon linguaggio di trasferimento molto meglio delle linee di base ad hoc considerando le singole funzionalità in modo isolato, e raccogliamo informazioni su quali caratteristiche sono più informative per ogni diversa attività di PNL, che possono informare la selezione ad hoc futura anche senza l'uso del nostro metodo.Abstract
高リソース転送言語が低リソースタスク言語の精度を向上させるために使用されるクロスリンガル転送は、現在、低リソース言語における自然言語処理( NLP )のパフォーマンスを向上させるための貴重なツールである。 しかし、特定のタスク言語を考えると、どの言語から転送するかは明確ではなく、標準的な戦略は、臨機応変な基準、通常は実験者の直感に基づいて言語を選択することである。 多くの特徴が、クロスリンガル転送の成功に寄与しているため(系統学的類似性、類型的特性、語彙的重複、または利用可能なデータのサイズを含む)、最も啓蒙的な実験者でさえ、手元の特定のタスクのためにこれらすべての要因を考慮することはほとんどない。 本稿では、最適な転送言語を自動的に選択するこのタスクをランキングの問題として考え、前述の特徴を考慮してこの予測を行うモデルを構築する。 代表的なNLPタスクの実験では、私たちのモデルは、単一の特徴を孤立的に考慮したアドホックなベースラインよりもはるかに優れた良好な転送言語を予測し、異なるNLPタスクごとに最も有益な特徴についての洞察を収集することを実証します。これは、私たちの方法を使用しなくても、将来のアドホックな選択に役立つかもしれません。Abstract
ProgressBarUpdates Nanging, nambah lang nggawe bener, ora nggarap kanggo langkung nggawe layar kanggo ngerasah, lan padha stiftar nggawe langkung sing basa sing saboh akra awak dhéwé, kudu kesempatan kapan ingkang sing apik. Dino akeh akeh sing nduwé operasi sing kontribusi nggawe seneng nggawe gerarané karo pawaran langgar-langgar (gambar tekan anyar pinterne, nggawe parakno, akeh operasi layakno, nggawe akeh operasi layakno), bah akeh sing nguasai perbudhakan langgar sampeyan nganggo sakjane operasi iki dadi. In this paper, we count this task of automatically select Optical transfer language as a ranging question, and create modeles that count the previous settings for this preview. Awak dhéwé éntuk éntuk prelimentar NLP gak bener, kita sembarang nggawe model sing nyimpen langkung sing luwih apik karo ads HocAbstract
მრავალური ტრანსტრენსი, სადაც მეტი რესურსის ტრანსტრენსი ენათი გამოყენებულია, რომელიც ცოტა რესურსის ტრანსტრენსის სიტყვის წესების წესების წესების წესების წესების წესების შესაძლებლო მაგრამ, განსაკუთრებული დავალების ენაზე, არ არის წარმოიდგინე რომელის ენაზე გადატანდეს, და სტანდერული სტრატიგია არის ad hoc კრიტერიტების განსაკუთრებული ენაზე, რომელიც ექსპერიმენტების ინ რადგან დიდი ფუნქციების რაოდენობა მრავალური ტრანსპერიმენტის წარმატებისთვის შემდეგ (გულისხმებით ფილოგენეტიკური განსხვავება, ტიპოლოგიური განსაზღვრება, ლექსიკალური გადარჩენება, ან ხელხილური მონაცე ამ დომენტში, ჩვენ აღმოვაჩნეთ ეს საქმე, რომ ავტომატურად მონიშნოთ ოპტიმალური ტრანსტრიქციის ენები როგორც პრობლემის პრობლემი, და შევქმნა მოდელები, რომლები ექსპერიმენტებში, რომელიც გამოსახულებული NLP მოქმედების შესახებ, ჩვენი მოდელეში უფრო უკეთესია გადატანსტრებული ენები, ვიდრე ad hoc ფესტრებული ენები, რომელიც იზოლაციაში ერთადერთი ფესტურებების შესახებ, და შეგვიძლია შეიძლება იგივეAbstract
Төмен ресурстар тапсырмалар тілінің дұрыстығын жақсарту үшін көптеген тілді көптеген тілді аудару үшін қолданылатын, қазір тапсырмалар тілді өзгерту үшін тапсырмалар тілдерін (NLP) төмен ресурстар тілдерінде жұмыс Бірақ бір тапсырманың тілі келтірілген, қайсы тілден аударылатын тілді таңдау үшін, стандартты стратегия - ad hoc критерияларына негізделген тілді таңдау, әдетте эксперименттердің интуициясы. Ең көп мүмкіндіктері бірнеше тілді аудару сәттігіне көмектеседі (филогенетикалық ұқсас, типтологиялық қасиеттер, лексикалық аудару немесе қол жеткізетін деректердің өлшеміне көмектеседі), сонымен қатар, ең жарықтық эксперименттер б Бұл қағазда, бұл тапсырманы автоматты түрде оптимал аудару тілдерін жоғары мәселе ретінде таңдау және бұл тапсырманы алдындағы мүмкіндіктерді орындау үшін үлгілер құру үші NLP тапсырмаларындағы тәжірибелер үшін біз үлгіміздің ad hoc негізгі тілдеріне жақсы тапсырмаларды өзгерту үшін жақсы тапсырмаларды өзгертуге болады деп көрсетеді. Бұл әрбір түрлі NLP тапсырмаларындағы мүмкіндіктердің ең жақсы мәліметтерінAbstract
다중 언어 마이그레이션, 즉 고자원 마이그레이션 언어를 사용하여 저자원 작업 언어의 정확성을 높이는 것은 자연언어처리(NLP)의 저자원 언어 성능을 향상시키는 귀중한 도구이다.그러나 특정한 임무 언어를 정하고 어느 언어에서 전환되는지 알 수 없다. 표준 전략은 특정한 기준(일반적으로 실험자의 직감)에 따라 언어를 선택한다.대량의 특징은 다중 언어 이동의 성공(시스템 발육의 유사성, 유형학적 특성, 어휘가 중첩되거나 사용할 수 있는 데이터의 크기 포함)에 도움이 되기 때문에 가장 명확한 실험자라도 주어진 특정한 임무의 모든 요소를 고려하지 않는다.본고에서 우리는 자동으로 가장 좋은 이동 언어를 선택하는 임무를 정렬 문제로 간주하고 상기 특징을 고려한 모델을 구축하여 이 예측을 실행할 것이다.대표적인 NLP 임무의 실험에서 우리는 우리의 모델이 단일 특징을 단독으로 고려하는 즉석 기선보다 양호한 이동 언어를 더 잘 예측하고 각기 다른 NLP 임무의 어떤 특징에 대한 정보량이 가장 큰지에 대한 견해를 수집하는 것이 미래의 즉석 선택에 정보를 제공할 수 있음을 증명했다. 설령 우리의 방법을 사용하지 않더라도.Abstract
Tarpkalbis perdavimas, kai didelių išteklių perdavimo kalba naudojama mažai išteklių turinčios užduočių kalbos tikslumui gerinti, dabar yra neįkainojama priemonė gerinti gamtos kalbų perdirbimo (NLP) rezultatus mažai išteklių turinčiose kalbose. Tačiau, atsižvelgiant į konkrečią užduočių kalbą, neaišku, iš kurios kalbos perkelti, ir standartinė strategija yra pasirinkti kalbas, pagrįstas ad hoc kriterijais, paprastai eksperto intuicija. Since a large number of features contribute to the success of cross-lingual transfer (including phylogenetic similarity, typological properties, lexical overlap, or size of available data), even the most enlightened experimenter rarely considers all these factors for the particular task at hand. Šiame dokumente manome, kad ši užduotis – automatiškai pasirinkti optimalias perdavimo kalbas – yra klasifikavimo problem a ir sukurti modelius, kuriais būtų atsižvelgta į pirmiau minėtus požymius, kad būtų galima atlikti šią prognozę. Eksperimentuose dėl reprezentatyvių NLP užduočių mes parodome, kad mūsų modelis numato geras perdavimo kalbas daug geriau nei ad hoc bazinės linijos, kuriose atskirai atsižvelgiama į atskiras savybes, ir sužinosime, kokios savybės yra labiausiai informacinės kiekvienai skirtingai NLP užduočiai, kurios gali informuoti būsimą ad hoc atranką net nepasinaudojant mūsų metodu.Abstract
Кросјазичен трансфер, каде што се користи јазик на трансфер со високи ресурси за подобрување на точноста на јазикот со ниски ресурси на задачи, сега е непроценлива алатка за подобрување на перформансата на природното обработување јазик (НЛП) на јазиците со ниски ре Сепак, со оглед на одреден јазик на задачите, не е јасно од кој јазик треба да се префрли, а стандардната стратегија е да се изберат јазици базирани на адхок критериуми, обично интуицијата на експериментарот. Бидејќи голем број карактеристики придонесуваат за успехот на прекујазичкиот трансфер (вклучувајќи ја и филогенетската сличност, типологичките сопствености, лексикалната прекопачка или големината на достапните податоци), дури и најосветлениот експериментер ретко ги смета сите овие фактори за конкретната зад Во овој весник, ја сметаме оваа задача за автоматски избор на оптимални трансферентни јазици како проблем со рангирање, и изградба на модели кои ги сметаат наведените карактеристики за извршување на оваа предвидување. Во експериментите на претставничките задачи на НЛП, ние демонстрираме дека нашиот модел предвидува добри јазици на трансфер многу подобри од адхок базите со оглед на единствените карактеристики во изолација, и објаснуваме кои карактеристики се најинформативни за секоја различна НЛП задача, што може да ја информира идната адAbstract
ക്രോസ്-ലാങ്കുകള് മാറ്റുന്ന ഭാഷ കുറഞ്ഞ വിഭവങ്ങളുടെ ഭാഷ മുന്കൂട്ടുവാന് ഉപയോഗിക്കുന്നുവെങ്കില്, ഇപ്പോള് സ്വാഭാവിക ഭാഷ പ്രവര്ത്തനപ്രക്രിയയുടെ പ്ര എന്നാലും ഒരു പ്രത്യേക ജോലിയുടെ ഭാഷ കൊണ്ട്, ഏത് ഭാഷയില് നിന്ന് മാറ്റാന് വ്യക്തമായിട്ടില്ല, സാധാരണ ഘടനയുടെ ഭാഷകള് വിദേശ ക്രിയകള് അടിസ് ക്രിസ്ലോഗെന്റിക് മാറ്റുന്നതിനുള്ള വിജയത്തിന്റെ വിജയത്തില് വലിയ വിശേഷങ്ങള് സഹായിക്കുന്നത് കൊണ്ടാണു് (ഫൈലോജനറ്റിക്ക് തുല്യമാണു്, ടൈപ്ലോളജിക്കല് ഗുണഗണങ്ങള ഈ പത്രത്തില്, നമ്മള് സ്വയം ഭാഷകള് സ്വയമായി മാറ്റുന്നത് ഒരു റാങ്ങിങ് പ്രശ്നമായി തെരഞ്ഞെടുക്കുന്ന ഈ ജോലിയാണെന്ന് കരുതുന്നു. ഈ പ പ്രതിനിധികളുടെ പ്രതിനിധികള് NLP ജോലികളില് നമ്മുടെ മോഡല് പ്രത്യക്ഷപ്പെടുത്തുന്നത് നമ്മുടെ ഭാഷകള് പരസ്പരം മാറ്റുന്നതിനേക്കാള് നല്ല ഭാഷകള് പ്രവചിക്കുന്നു എന്നാണ്. ഒറ്റയ്ക്ക് വേണAbstract
Хэдхэн хэлний шилжүүлэлт, хаана хамгийн өндөр боловсролын шилжүүлэлт хэл бага боловсролын ажлын хэл дээр зөвшөөрөхөд хэрэглэгддэг бөгөөд одоо бага боловсролын хэл дээр байгалийн хэл үйлдвэрлэлтийн үр дүнг сайжруулахын тулд үнэ ц Гэхдээ тодорхой ажлын хэл боловч, ямар хэл шилжүүлэхийг тодорхойлж чадахгүй. Стандарт стратеги бол ad hoc шалгалтын үндсэн хэл сонгох, ихэвчлэн туршилтын үзэл бодол. Ихэнх сонирхолтой нь хэл хэлний шилжүүлэлтийн амжилтын тулд (филогенетик төстэй, типтологик чанар, лексикийн давхар, эсвэл хэрэглэгдэх өгөгдлийн хэмжээнд) тулгарч байгаа учраас хамгийн тодорхой туршилтчид эдгээр бүх хүчин зүйлсийг ойлгоход хово Энэ цаасан дээр бид үүнийг автоматаар эерэг шилжүүлэлтийн хэлнүүдийг цуврал асуудал гэж сонгож, өнөөдөр байгаа чадваруудыг энэ таамаглал хийх гэж боддог загваруудыг бүтээж байна. NLP-ын төлөөлөгчийн даалгаварын туршилтуудад бидний загвар нь ad hoc суурь шугам шугам гэдгээс илүү сайн шилжүүлэх хэлнүүдийг ганц боломжтой байдлыг ойлгож, NLP-ын даалгавар бүрт хамгийн мэдээллийн талаар ойлгох боломжтой болно. Энэ нь бидний арга загвараас ч ашиглахгүй ирээAbstract
Pemindahan saling bahasa, di mana bahasa pemindahan sumber-tinggi digunakan untuk meningkatkan ketepatan bahasa tugas sumber-rendah, kini adalah alat yang tidak berharga untuk meningkatkan prestasi pemprosesan bahasa alam (NLP) pada bahasa sumber-rendah. However, given a particular task language, it is not clear which language to transfer from, and the standard strategy is to select languages based on ad hoc criteria, usually the intuition of the experimenter. Oleh kerana sejumlah besar ciri-ciri berkontribusi kepada kejayaan pemindahan saling bahasa (termasuk persamaan filogenetik, ciri-ciri tipologi, meliputi lexik, atau saiz data yang tersedia), walaupun eksperimen yang paling terang jarang mempertimbangkan semua faktor ini untuk tugas tertentu yang ada. Dalam kertas ini, kami mempertimbangkan tugas ini untuk memilih secara automatik bahasa pemindahan optimal sebagai masalah penataran, dan membina model yang mempertimbangkan ciri-ciri yang terdahulu untuk melaksanakan ramalan ini. Dalam eksperimen mengenai tugas mewakili NLP, kami menunjukkan bahawa model kami meramalkan bahasa pemindahan yang baik jauh lebih baik daripada garis dasar ad hoc mempertimbangkan ciri-ciri tunggal dalam pengasingan, dan mencari tahu apa ciri-ciri yang paling maklumat untuk setiap tugas NLP yang berbeza, yang mungkin memberitahu pemilihan ad hoc masa depan walaupun tanpa menggunakan kaedah kami.Abstract
It-trasferiment translingwi, fejn tintuża lingwa ta’ trasferiment b’riżorsi għoljin biex tittejjeb il-preċiżjoni ta’ lingwa ta’ kompiti b’riżorsi baxxi, issa huwa għodda inestimabbli għat-titjib tal-prestazzjoni tal-ipproċessar tal-lingwi naturali (NLP) fuq lingwi b’riżorsi baxxi. Madankollu, minħabba lingwa ta’ kompitu partikolari, mhuwiex ċar minn liema lingwa għandha tiġi trasferita, u l-istrateġija standard hija li jintgħa żlu lingwi bbażati fuq kriterji ad hoc, normalment l-intwizzjoni tal-esperimentatur. Minħabba li għadd kbir ta’ karatteristiċi jikkontribwixxu għas-suċċess tat-trasferiment translingwistiku (inkluż similarità filoġenetika, karatteristiċi tipoloġiċi, duplikazzjoni lexika, jew id-daqs tad-dejta disponibbli), anke l-esperimentatur l-aktar imdawwal rarament jikkunsidra dawn il-fatturi kollha għall-kompitu partikolari inkwistjoni. In this paper, we consider this task of automatically selecting optimal transfer languages as a ranking problem, and build models that consider the aforementioned features to perform this prediction. In experiments on representative NLP tasks, we demonstrate that our model predicts good transfer languages much better than ad hoc baselines considering single features in isolation, and glean insights on what features are most informative for each different NLP tasks, which may inform future ad hoc selection even without use of our method.Abstract
Cross-lingual transfer, waarbij een high-resource transfer taal wordt gebruikt om de nauwkeurigheid van een low-resource taaktaal te verbeteren, is nu een onschatbare tool voor het verbeteren van de prestaties van natuurlijke taalverwerking (NLP) op low-resource talen. Gezien een bepaalde taaktaal is het echter niet duidelijk uit welke taal moet worden overgezet, en de standaardstrategie is om talen te selecteren op basis van ad-hoccriteria, meestal de intuïtie van de experimentator. Aangezien een groot aantal kenmerken bijdragen aan het succes van cross-lingual transfer (waaronder fylogenetische gelijkenis, typologische eigenschappen, lexicale overlapping, of grootte van beschikbare gegevens), zelfs de meest verlichte experimentator overweegt zelden al deze factoren voor de specifieke taak. In dit artikel beschouwen we deze taak om automatisch optimale overdrachtstalen te selecteren als een rankingprobleem en bouwen we modellen die rekening houden met de bovengenoemde kenmerken om deze voorspelling uit te voeren. In experimenten met representatieve NLP-taken laten we zien dat ons model goede overdrachtstalen veel beter voorspelt dan ad hoc-baselines die afzonderlijke functies afzonderlijk beschouwen, en krijgen we inzicht in welke functies het meest informatief zijn voor elke verschillende NLP-taken, die toekomstige ad hoc-selectie kunnen beïnvloeden, zelfs zonder gebruik van onze methode.Abstract
Krysspråk overføring, der eit høg ressursoverføringsspråk vert brukt for å forbedra nøyaktighet på ei låg ressursoppgåvespråk, er no eit gyldig verktøy for å forbetra utviklinga av naturspråk-handtering (NLP) på låg ressursspråk. Det er imidlertid ikkje klart kva språk som skal overførast frå, og standardstratet er å velja språk basert på ad hoc- kriterioar, vanlegvis intuisjonen av eksperimenteren. Sidan mange funksjonar bidra til suksess på krysspråk overføring (inkludert filogenetiske liknande, typologiske eigenskapar, leksiske overlapping eller storleik på tilgjengelege data), selv den mest klarte eksperimenteren ser ofte på alle desse faktorene for den bestemte oppgåva ved hånd. I denne papiret ser vi denne oppgåva til å automatisk velja optimal overføringsspråk som eit rankeringsproblem, og bygge modeller som ser på dei førehandsviste funksjonane for å utføra denne forhåndsvisinga. I eksperimenter på reprezentativ NLP-oppgåver viser vi at modellen vårt foregår godt overføringsspråk mykje bedre enn ad hoc-baselinjer som ser på enkelte funksjonar i isolation, og glean innsyningar om kva funksjonar er mest informativ for kvar ulike NLP-oppgåver, som kan informere framtidig ad hoc-utval sjølv utan bruk av metoden vårt.Abstract
Transfer między językami, w którym język transferu wysokich zasobów jest używany do poprawy dokładności języka zadań o niskich zasobach, jest obecnie nieocenionym narzędziem do poprawy wydajności przetwarzania języka naturalnego (NLP) w językach o niskich zasobach. Jednak biorąc pod uwagę konkretny język zadania, nie jest jasne, z którego języka przenieść, a standardową strategią jest wybór języków w oparciu o kryteria ad hoc, zwykle intuicję eksperymentującego. Ponieważ duża liczba cech przyczynia się do sukcesu transferu między językami (w tym podobieństwo filogenetyczne, właściwości typologiczne, nakładanie się leksykaliczne lub wielkość dostępnych danych), nawet najbardziej oświecony eksperyment rzadko uwzględnia wszystkie te czynniki dla konkretnego zadania. W niniejszym artykule rozważamy to zadanie automatycznego wyboru optymalnych języków transferowych jako problem rankingowy i budujemy modele uwzględniające wyżej wymienione cechy do przeprowadzenia tej predykcji. W eksperymentach na reprezentatywnych zadaniach NLP pokazujemy, że nasz model przewiduje dobre języki transferowe znacznie lepiej niż podstawowe ad hoc biorąc pod uwagę pojedyncze cechy w izolacji, i uzyskujemy spostrzeżenia, które cechy są najbardziej informacyjne dla każdego z różnych zadań NLP, które mogą pomóc w przyszłości wyborze ad hoc nawet bez użycia naszej metody.Abstract
A transferência multilíngue, em que uma linguagem de transferência de alto recurso é usada para melhorar a precisão de uma linguagem de tarefa com poucos recursos, é agora uma ferramenta inestimável para melhorar o desempenho do processamento de linguagem natural (PLN) em idiomas com poucos recursos. No entanto, dada uma determinada linguagem de tarefa, não está claro de qual linguagem transferir, e a estratégia padrão é selecionar linguagens com base em critérios ad hoc, geralmente a intuição do experimentador. Uma vez que um grande número de características contribui para o sucesso da transferência entre línguas (incluindo semelhança filogenética, propriedades tipológicas, sobreposição lexical ou tamanho dos dados disponíveis), mesmo o experimentador mais esclarecido raramente considera todos esses fatores para a tarefa específica em mãos. Neste artigo, consideramos essa tarefa de selecionar automaticamente linguagens de transferência ótimas como um problema de classificação, e construímos modelos que consideram os recursos mencionados acima para realizar essa previsão. Em experimentos com tarefas representativas de PNL, demonstramos que nosso modelo prevê boas linguagens de transferência muito melhor do que linhas de base ad hoc, considerando recursos únicos isoladamente, e coletamos insights sobre quais recursos são mais informativos para cada tarefa de PNL diferente, o que pode informar futura seleção ad hoc mesmo sem o uso do nosso método.Abstract
Transferul interlingv, în cazul în care un limbaj de transfer cu resurse ridicate este utilizat pentru a îmbunătăți acuratețea unui limbaj de sarcini cu resurse reduse, este acum un instrument neprețuit pentru îmbunătățirea performanței procesării limbajului natural (PNL) pe limbile cu resurse reduse. Cu toate acestea, având în vedere un anumit limbaj de sarcină, nu este clar din ce limbă să transfere, iar strategia standard este de a selecta limbile bazate pe criterii ad hoc, de obicei intuiția experimentatorului. Deoarece un număr mare de caracteristici contribuie la succesul transferului translingvistic (inclusiv similaritatea filogenetică, proprietățile tipologice, suprapunerea lexicală sau dimensiunea datelor disponibile), chiar și cel mai iluminat experimentator rareori ia în considerare toți acești factori pentru sarcina particulară. În această lucrare, considerăm această sarcină de selectare automată a limbilor optime de transfer ca o problemă de clasare și de a construi modele care iau în considerare caracteristicile menționate mai sus pentru a efectua această predicție. În experimentele pe sarcini reprezentative PNL, demonstrăm că modelul nostru prezice limbaje de transfer bune mult mai bine decât liniile de bază ad hoc luând în considerare caracteristicile individuale în mod izolat, și obținem informații despre caracteristicile care sunt cele mai informative pentru fiecare sarcină diferită PNL, ceea ce poate informa selecția ad hoc viitoare chiar și fără utilizarea metodei noastre.Abstract
Кросс-лингвистическая передача, при которой используется высокоресурсный язык передачи для повышения точности малоресурсного языка задач, в настоящее время является бесценным инструментом для улучшения производительности обработки естественного языка (NLP) на малоресурсных языках. Однако, учитывая конкретный язык задачи, неясно, с какого языка следует переходить, и стандартная стратегия заключается в выборе языков на основе специальных критериев, обычно интуиции экспериментатора. Поскольку большое количество признаков способствует успеху межязыковой передачи (включая филогенетическое сходство, типологические свойства, лексическое перекрытие или размер доступных данных), даже самый просвещенный экспериментатор редко учитывает все эти факторы для конкретной задачи. В данной работе мы рассматриваем эту задачу автоматического выбора оптимальных языков перевода в качестве задачи ранжирования и строим модели, которые учитывают вышеупомянутые особенности для выполнения этого прогноза. В экспериментах над репрезентативными задачами NLP мы демонстрируем, что наша модель предсказывает хорошие языки передачи гораздо лучше, чем специальные базовые линии, учитывая отдельные особенности в изоляции, и получаем представления о том, какие функции являются наиболее информативными для каждой отдельной задачи NLP, которые могут быть использованы в будущем при выборе ad hoc даже без использования нашего метода.Abstract
ක්රොස් භාෂාවක් ප්රවර්තනය, කොහෙද උත්සත්වක් ප්රවර්තනය භාෂාව ප්රවර්තනය කරන්න පුළුවන් විතරයි, දැන් ප්රාකෘතික භාෂාව ප්රවර්තන නමුත්, විශේෂ වැඩක් භාෂාවක් දෙන්න, ඒක පැහැදිලි නැහැ කොන භාෂාව ප්රවර්තනය කරන්න, ඒ වගේම ස්ථාවිත භාෂාව තෝර ඉස්සරහා ලොකු සංඛ්යාවක් සම්බන්ධ විශ්වාසයේ සාර්ථාව සම්බන්ධ විදියට (phylog enetic SimLarity, typology සාර්ථාවික විශේෂතාවක්, lexic overLap, or size of open data), සමහර විශේෂ ව මේ පත්තරේ අපි හිතන්නේ මේ වැඩේ ස්වයංක්රියාවිතයෙන් ප්රශ්නයක් වෙනුවෙන් ස්වයංක්රියාවිතයෙන් ප්රශ්නයක් විදි අපි ප්රධානිය NLP වැඩේ පරීක්ෂණාවට ප්රතික්ෂා කරනවා අපේ මොඩල් හොඳ ප්රයෝජනය භාෂාවට ad hoc ප්රයෝජනය වඩා හොඳයි කියලා ප්රතික්ෂණය කරනවා කියලා ප්රතික්ෂණය කරනවා අනAbstract
Medjezični prenos, pri katerem se jezik prenosa z visokimi viri uporablja za izboljšanje natančnosti opravilnega jezika z nizkimi viri, je zdaj neprecenljivo orodje za izboljšanje učinkovitosti obdelave naravnega jezika (NLP) v jezikih z nizkimi viri. Vendar glede na določen jezik naloge ni jasno, iz katerega jezika naj se prenese, standardna strategija pa je izbira jezikov na podlagi ad hoc meril, običajno intuicije izvajalca eksperimentov. Ker veliko število značilnosti prispeva k uspehu medjezičnega prenosa (vključno s filogenetsko podobnostjo, tipološkimi lastnostmi, leksikalnim prekrivanjem ali velikostjo razpoložljivih podatkov), celo najbolj razsvetljeni eksperimentator redko upošteva vse te dejavnike za posamezno nalogo. V tem prispevku obravnavamo to nalogo samodejnega izbire optimalnih jezikov prenosa kot težavo razvrščanja in gradimo modele, ki upoštevajo zgoraj navedene funkcije za izvedbo te napovedi. V eksperimentih reprezentativnih nalog NLP dokazujemo, da naš model napoveduje dobre prenosne jezike veliko bolje kot ad hoc osnovne vrstice ob upoštevanju posameznih funkcij ločeno, in zberemo vpogled v to, katere funkcije so najbolj informativne za vsako različno opravilo NLP, kar lahko podpira prihodnjo ad hoc izbiro tudi brez uporabe naše metode.Abstract
Isku wareejinta luqada iskuulka ah oo lagu isticmaalo in lagu kordhiyo saxda luuqada shaqada ee hoos-resource, hadda waa qalabka a an qiimayn karin in uu horumariyo sameynta baaritaanka afka asalka ah (NLP) oo ku qoran luqadaha hoose-resource. Si kastaba ha ahaatee, in luqada shaqo oo gaar ah lagu sameeyo, ma cad in luqada laga soo wareejiyo, strategiga caadiga ahna waa in lagu doorto luuqadaha ku saleysan kaararka gaarka ah, sida caadiga ah qalabka imtixaanka. Sidaa darteed waxaa ku saabsan guulaysta wareejinta luuqadaha kala duwan (包括feylogenetka isku mid ah, hantidiisa typological, boolidka leksikalka ama tirada la heli karo), xataa imtixaanka aad u fududaysan waxyaabahan oo dhan waxyaabaha gaarka ah ee shaqada. Warqadan waxaynu ka fiirsannaa shaqadaas aan si automatic ah u dooranayno luuqada bedelka si ay u tahay dhibaato kala duwan, waxaana dhisaynaa modello ka fiirsada qaababka horay loo sii sheegay in la sameeyo wixii la soo sheegay. Imtixaamo ku saabsan shaqaalaha wakiilka NLP, waxaynu muujinnaa in modelkayagu sii sheego luuqadaha wanaagsan oo ka wanaagsan baaraandegista hoose-bannaan oo ka fiirsanaya gooni gaar ah, waxaana ka fiirsanaynaa waxyaabaha ay ugu macluumaad badan yihiin shaqada NLP oo kala duduwan, kaas oo u sheegi kara doorasho khaas ah oo aan isticmaaleyn qaababkayaga.Abstract
Transferimi ndërgjuhësor, ku një gjuhë transferimi i burimeve të larta përdoret për të përmirësuar saktësinë e një gjuhë me burime të ulëta, është tani një mjet i çmuar për përmirësimin e performancës së procesimit natyror të gjuhës (NLP) në gjuhët me burime të ulëta. Megjithatë, duke marrë parasysh një gjuhë të veçantë detyrash, nuk është e qartë nga cila gjuhë të transferohet dhe strategjia standarte është të zgjedhësh gjuhë bazuar në kritere ad hoc, zakonisht intuita e eksperimentuesit. Since a large number of features contribute to the success of cross-lingual transfer (including phylogenetic similarity, typological properties, lexical overlap, or size of available data), even the most enlightened experimenter rarely considers all these factors for the particular task at hand. In this paper, we consider this task of automatically selecting optimal transfer languages as a ranking problem, and build models that consider the aforementioned features to perform this prediction. Në eksperimentet mbi detyrat përfaqësuese të NLP, ne demonstrojmë se modeli ynë parashikon gjuhë të mira të transferimit shumë më të mira se linjat bazë ad hoc duke konsideruar karakteristika të vetme në izolim dhe duke mbledhur parasysh se cilat karakteristika janë më informative për çdo detyrë të ndryshme të NLP, që mund të informojnë zgjedhjen e ardhshme ad hoc edhe pa përdorur metodën tonë.Abstract
Prebacivanje kroz jezik, gde se koristi jezik prebacivanja visokih resursa za poboljšanje tačnosti jezika niskog resursa, sada je neprocjenjiv alat za poboljšanje izvodnosti prirodnog obrade jezika (NLP) na jezicima niskog resursa. Međutim, s obzirom na određeni jezik zadatka, nije jasno od kojeg jezika treba prebaciti, a standardna strategija je da odaberemo jezike na osnovu ad hoc kriterija, obično intuicija eksperimentatora. Pošto veliki broj karakteristika doprinose uspjehu preko jezika prenošenja (uključujući filogenetičku sličnost, tipološke vlasti, leksički preklapanje ili veličinu dostupnih podataka), čak i najprosvjetljeniji eksperimenter rijetko smatra sve te faktore za određeni zadatak. U ovom papiru smatramo zadatak automatskog izabranja optimalnih jezika prebacivanja kao problem u redovima i izgradnja modela koji smatraju predviđenim karakteristikama da bi izvršili ovu predviđanje. U eksperimentima o reprezentativnim zadacima NLP pokazujemo da naš model predviđa dobre prevozne jezike mnogo bolje nego ad hoc osnovne linije s obzirom na jedine karakteristike u izolaciji, i glean uvid o tome kakve su karakteristike najinformativnije za svaki različiti zadatak NLP-a, koji može informirati budući ad hoc izbor čak i bez upotrebe našeg metoda.Abstract
Tvärspråkig överföring, där ett överföringsspråk med hög resurs används för att förbättra noggrannheten i ett uppgiftsspråk med låg resurs, är nu ett ovärderligt verktyg för att förbättra prestanda för behandling av naturligt språk (NLP) på språk med låg resurs. Med tanke på ett visst uppgiftsspråk är det dock inte klart vilket språk som ska överföras från, och standardstrategin är att välja språk baserat på ad hoc kriterier, vanligtvis experimenterande intuition. Eftersom ett stort antal funktioner bidrar till framgången för tvärspråklig överföring (inklusive fylogenetisk likhet, typologiska egenskaper, lexikal överlappning eller storlek på tillgängliga data), överväger även den mest upplysta försökspersonen sällan alla dessa faktorer för den specifika uppgiften. I denna uppsats betraktar vi uppgiften att automatiskt välja optimala överföringsspråk som ett rankningsproblem, och bygga modeller som beaktar ovan nämnda funktioner för att utföra denna förutsägelse. I experiment med representativa NLP-uppgifter visar vi att vår modell förutspår bra överföringsspråk mycket bättre än ad hoc-baselines med hänsyn till enskilda funktioner isolerat, och får insikter om vilka funktioner som är mest informativa för varje enskild NLP-uppgift, vilket kan leda till framtida ad hoc-val även utan användning av vår metod.Abstract
Uhamiaji wa lugha yenye lugha, ambapo lugha ya usafirishaji wa rasilimali ya juu inatumika kuboresha uhakika wa lugha ya rasilimali ya chini ya rasilimali, sasa ni zana muhimu ya kuboresha ufanisi wa upasuaji wa lugha za asili (NLP) katika lugha ndogo ya rasilimali. Hata hivyo, kwa kutumia lugha maalum ya kazi, si wazi ni lugha gani ya kuhamisha kutoka, na mkakati wa kiwango cha kawaida ni kuchagua lugha kwa kutumia vigezo maalum, mara nyingi mtazamo wa mtafiti. Kwa kuwa vipengele vingi vingi vinatoa mafanikio ya usafirishaji wa lugha mbalimbali (ikiwa ni pamoja na ufafanuzi wa utambulisho wa lugha, vifaa vya kitaalamu, vifaa vya kiutamaduni, au ukubwa wa taarifa zinazopatikana), hata mtihani mwenye mwangaza unaoeleweka unachukulia vigezo vyote hivi kwa kazi maalum. Katika karatasi hii, tunafikiria jukumu hili la kujichagua lugha za kubadilisha matumaini kama tatizo la kutangaza, na kujenga mifano ambayo hufikiria vipengele vilivyotajwa hapo awali ili kutekeleza utabiri huu. Katika majaribio kuhusu kazi za mwakilishi wa NLP, tunaonyesha kuwa modeli yetu inatabiri lugha nzuri zaidi ya misingi ya msingi wa ajabu kwa kuangalia vipengele pekee katika kipekee, na kuona kina taarifa zaidi kwa kila kazi tofauti za NLP, ambazo inaweza kutoa taarifa za uchaguzi mkubwa wa baadae bila kutumia njia yetu.Abstract
Cross-lingual transfer, where a high-resource transfer language is used to improve the accuracy of a low-resource task language, is now an invaluable tool for improving performance of natural language processing (NLP) on low-resource languages. ஆனால், குறிப்பிட்ட செயல் மொழி கொடுக்கப்பட்டால், எந்த மொழி இருந்து மாற்ற வேண்டும் என்பது தெளிவாக இல்லை, மற்றும் நிலையான திட்டம் தனிப்பட பெரிய குணங்களின் வெற்றியை கொண்டு பல மொழி மாற்றுதலின் வெற்றியில் செலவு செய்துள்ளதால் (சொல்லஜென்டிக் ஒற்றைப்படையாக, வகையாளர் பண்புகள், லெக்சியல் மேற்பாடு, அல்லது இந்த காகிதத்தில், நாம் தானாகவே தேர்ந்தெடுத்து விருப்பமான மொழிகளை மாற்றும் பிரச்சனையாக கருதுகிறோம். முன்னோக்கிய குணங்கள NLP பணிகளை பிரதிநிதியாக்கும் சோதனைகளில், எங்கள் மாதிரி சிறந்த மொழிகளை விட மேலான மொழிகளை மாற்றுவதை காண்பிக்கிறது என்பதை நாம் குறிப்பிடுகிறோம். தனியாக தனிப்பயன்களை பார்த்து, மற்றும் தனிபAbstract
Çapraz diller, iň ýokary ressurs taýýarlanmasy üçin ullanýan ýerde, bu ýerde tebigy diller işlemek üçin (NLP) iň az ressurs dilinde taýýarlanmasy üçin adalat bir araç. Ýöne, täze bir zadyň diline görkezilen bolsa, haýsy dilden terjime edilmelidigini belli etmeýär we standart stratejiýa ad hoc kriteriýasyna daýanýan dilleri saýlamakdyr, adatça eksperimentiň terjime edilmesi. Birnäçe karakterler cross-lingual terjimesine (phylogenetik meňzeşlikleri, typolojik hasaplaryň, leksiýal üstüne, ýada meňzeşli verilerniň ululyklaryna) täze bir şekilde, hatta iň aydınlan deneymanyň hemme bu hasaplaryň ählisini ýakynlaşsyz bolup biljek hasaplanýar. Bu kagyzda, biz bu zady öz-özüne optimale transfers dillerini derejesi bilen saýlamak we öňümizdeki özellikleri bu tahmin etmek üçin örän nusgalary gurap pikir edýäris. NLP reprezentanty zadlarynyň deneylerinde, biziň modelimiz ad hoc baseliniň ýeke özelliklerinde düşünýän gowy transferler dillerini, we her nähili NLP zadlarynyň has möhüm bolup bilýän zadyny çykaryp bilýäris. Bu biziň metodamyzdan hem gelejekde ad hoc saýlamagyny biljek.Abstract
Cross-lingual transfer, where a high-resource transfer language is used to improve the accuracy of a low-resource task language, is now an invalid tool for improving the performance of natural language processing (NLP) on low-resource languages. However, given a particular task language, it is not clear which language to transfer from, and the standard strategy is to select languages based on ad hoc criteria, usually the intuition of the experimenter. زیادہ تعداد ویژگی کی تعداد کے باعث cross-lingual transfer (phylogenetic similarity, typological properties, lexical overlap, or size of available data) کے موفقیت کے کام میں اضافہ کرتی ہے، اگرچہ سب سے زیادہ روشن آزمائش کرنے والی آزمائش کرنے والی بہت کم یہ فکتوروں کو محسوس کرتا ہے جو ان کے پاس ایک خاص کام کے لئے ہیں. اس کاغذ میں، ہم نے اس کام کو اپنا انتقال زبانوں کو رانڈینگ مشکل کے طور پر انتخاب کرنے کے لئے اپنا کام سمجھ لیا ہے، اور مدل بنا لیا ہے جو اس سے پہلے گزرے ہوئے ویژگی کو اس کی پیش بینی کے لئے سمجھ رہے ہیں. نمایشگر NLP تاسکیوں کی آزمائش میں ہم دکھاتے ہیں کہ ہماری نمایشگر نے اچھی ترنسیس زبانیں اڈ هاک بنیس لین سے بہتر ترنسیس زبانوں کی پیش بینی کرتی ہیں جو ایک فرصت کے متعلق ایک فرصت کے بارے میں سمجھتے ہیں اور کس فرصت کے متعلق سب مختلف NLP تاسکیوں کے لئے بہترین معلومات ہیں، جو آینده ad hocAbstract
Name Lekin, bir xil vazifa tili boʻlgan boʻlsa, qaysi tildan olib tashlash mumkin emas, andoza strategiya, ad hoc criteria asosida tillarni tanlash mumkin, oddiy muammiy tuzuvchining imkoniyatini tanlash mumkin. Chunki ko'pchilik imkoniyatlar o'zgarishga muvaffaqiyatli qo'shiladi (faylogenetik tenglari, typologik xossalari, leksikal kopqoʻshish yoki mavjud maʼlumot uchun sizga ko'p ko'proq imtiyozlar hamma narsalarni o'ylab turadi. Bu hujjatda, biz tillarni avtomatik o'zgartirishni tasavvur qilamiz, chegara muammola deb o'ylaymiz, va bu oldingi koʻrsatilgan imkoniyatlarni bajarish uchun modellarni yaratish. CommentAbstract
Giao dịch xuyên ngôn ngữ, nơi dùng một ngôn ngữ chuyển tài nguyên cao để cải thiện độ chính xác của ngôn ngữ công việc ít tài nguyên, giờ là một công cụ vô giá để cải thiện khả năng xử lý ngôn ngữ tự nhiên (Nchọc) về ngôn ngữ ít tài nguyên. Tuy nhiên, với một ngôn ngữ đặc biệt, không rõ phải chuyển từ ngôn ngữ nào, và chiến lược tiêu chuẩn là chọn ngôn ngữ dựa trên các tiêu chuẩn đặc biệt, thường là trực giác của người thử nghiệm. Vì rất nhiều tính năng đóng góp cho thành công của việc chuyển giao ngôn ngữ khác nhau (bao gồm tính cách di truyền, tính chất tự động, sự gấp bội ngôn ngữ, hay kích thước của dữ liệu có sẵn), thậm chí người thí nghiệm sáng suốt nhất hiếm khi xem tất cả các yếu tố này cho nhiệm vụ đặc biệt. Trong tờ giấy này, chúng tôi xem nhiệm vụ tự động chọn ngôn ngữ chuyển nhượng tối ưu là vấn đề xếp hạng, và xây dựng các mô hình xem những tính năng này để thực hiện dự đoán này. Trong các thí nghiệm về các công việc đại diện của Đảng NLP, chúng tôi thấy rằng mô hình của chúng tôi dự đoán ngôn ngữ chuyển nhượng tốt hơn nhiều so với hệ thống cơ bản chỉ dựa vào các chi tiết đặc biệt, và tìm hiểu được các tính chất hữu ích nhất cho từng công việc lập NLP, có thể cung cấp thông tin cho việc lựa chọn đặc biệt tương lai ngay cả khi không dùng phương pháp của chúng tôi.Abstract
跨语言传输,其用高资移言以重低资源任言之准确性,今贵低资源言之自然语言(NLP)性之宝器也。 然给定一特定之言,未详所移,准策临时择言,常为实验者直觉。 夫经济言语之成(统育相似性,类学性质,词汇重数之),虽至明之实验者,罕思特定务。 于本文中,择最佳者以为排名,而构此以行之。 代表性NLP之实验,吾证吾之善移言多于虑孤之基线,而收其异NLP者,虽有不用吾道,亦可以为未来之权择焉。- Anthology ID:
- P19-1301
- Volume:
- Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics
- Month:
- July
- Year:
- 2019
- Address:
- Florence, Italy
- Venue:
- ACL
- SIG:
- Publisher:
- Association for Computational Linguistics
- Note:
- Pages:
- 3125–3135
- Language:
- URL:
- https://aclanthology.org/P19-1301
- DOI:
- 10.18653/v1/P19-1301
- Bibkey:
- Cite (ACL):
- Yu-Hsiang Lin, Chian-Yu Chen, Jean Lee, Zirui Li, Yuyan Zhang, Mengzhou Xia, Shruti Rijhwani, Junxian He, Zhisong Zhang, Xuezhe Ma, Antonios Anastasopoulos, Patrick Littell, and Graham Neubig. 2019. Choosing Transfer Languages for Cross-Lingual Learning. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pages 3125–3135, Florence, Italy. Association for Computational Linguistics.
- Cite (Informal):
- Choosing Transfer Languages for Cross-Lingual Learning (Lin et al., ACL 2019)
- Copy Citation:
- PDF:
- https://aclanthology.org/P19-1301.pdf
- Code
- neulab/langrank
- Terminologies:
Export citation
@inproceedings{lin-etal-2019-choosing, title = "Choosing Transfer Languages for Cross-Lingual Learning", author = "Lin, Yu-Hsiang and Chen, Chian-Yu and Lee, Jean and Li, Zirui and Zhang, Yuyan and Xia, Mengzhou and Rijhwani, Shruti and He, Junxian and Zhang, Zhisong and Ma, Xuezhe and Anastasopoulos, Antonios and Littell, Patrick and Neubig, Graham", booktitle = "Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics", month = jul, year = "2019", address = "Florence, Italy", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/P19-1301", doi = "10.18653/v1/P19-1301", pages = "3125--3135", }
<?xml version="1.0" encoding="UTF-8"?> <modsCollection xmlns="http://www.loc.gov/mods/v3"> <mods ID="lin-etal-2019-choosing"> <titleInfo> <title>Choosing Transfer Languages for Cross-Lingual Learning</title> </titleInfo> <name type="personal"> <namePart type="given">Yu-Hsiang</namePart> <namePart type="family">Lin</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Chian-Yu</namePart> <namePart type="family">Chen</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Jean</namePart> <namePart type="family">Lee</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Zirui</namePart> <namePart type="family">Li</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Yuyan</namePart> <namePart type="family">Zhang</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Mengzhou</namePart> <namePart type="family">Xia</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Shruti</namePart> <namePart type="family">Rijhwani</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Junxian</namePart> <namePart type="family">He</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Zhisong</namePart> <namePart type="family">Zhang</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Xuezhe</namePart> <namePart type="family">Ma</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Antonios</namePart> <namePart type="family">Anastasopoulos</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Patrick</namePart> <namePart type="family">Littell</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Graham</namePart> <namePart type="family">Neubig</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <originInfo> <dateIssued>2019-07</dateIssued> </originInfo> <typeOfResource>text</typeOfResource> <relatedItem type="host"> <titleInfo> <title>Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics</title> </titleInfo> <originInfo> <publisher>Association for Computational Linguistics</publisher> <place> <placeTerm type="text">Florence, Italy</placeTerm> </place> </originInfo> <genre authority="marcgt">conference publication</genre> </relatedItem> <identifier type="citekey">lin-etal-2019-choosing</identifier> <identifier type="doi">10.18653/v1/P19-1301</identifier> <location> <url>https://aclanthology.org/P19-1301</url> </location> <part> <date>2019-07</date> <extent unit="page"> <start>3125</start> <end>3135</end> </extent> </part> </mods> </modsCollection>
%0 Conference Proceedings %T Choosing Transfer Languages for Cross-Lingual Learning %A Lin, Yu-Hsiang %A Chen, Chian-Yu %A Lee, Jean %A Li, Zirui %A Zhang, Yuyan %A Xia, Mengzhou %A Rijhwani, Shruti %A He, Junxian %A Zhang, Zhisong %A Ma, Xuezhe %A Anastasopoulos, Antonios %A Littell, Patrick %A Neubig, Graham %S Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics %D 2019 %8 July %I Association for Computational Linguistics %C Florence, Italy %F lin-etal-2019-choosing %R 10.18653/v1/P19-1301 %U https://aclanthology.org/P19-1301 %U https://doi.org/10.18653/v1/P19-1301 %P 3125-3135
Markdown (Informal)
[Choosing Transfer Languages for Cross-Lingual Learning](https://aclanthology.org/P19-1301) (Lin et al., ACL 2019)
- Choosing Transfer Languages for Cross-Lingual Learning (Lin et al., ACL 2019)
ACL
- Yu-Hsiang Lin, Chian-Yu Chen, Jean Lee, Zirui Li, Yuyan Zhang, Mengzhou Xia, Shruti Rijhwani, Junxian He, Zhisong Zhang, Xuezhe Ma, Antonios Anastasopoulos, Patrick Littell, and Graham Neubig. 2019. Choosing Transfer Languages for Cross-Lingual Learning. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pages 3125–3135, Florence, Italy. Association for Computational Linguistics.