Challenges and Strategies in Cross-Cultural NLP GlobalWoZ: Globalisering MultiWoZ om Multilingual Opdrag- Orienteerde Dialoog Systeme te ontwikkel አቀማመጥ GlobalWoZ: عولمة MultiWoZ لتطوير أنظمة حوار متعددة اللغات ذات مهام المنحى GlobalWoZ: Multilingual Task-Oriented Dialoog Sistemlərini Gelişdirmək üçün MultiWoZ Globalizing MultiWoZ Глобализиране на мултиWoZ за разработване на многоезични системи за диалог, ориентирани към задачите GlobalWoZ: বহুভাষার কাজের কাজ-অর্থিত ডায়ালগ সিস্টেম উন্নয়নের জন্য বিশ্লোবাস করা হচ্ছে GlobalWoZ: སྤྱི་ཚོགས་སྤྱོད་ཀྱི་ཆ་རྩིས་བློ་གཏད་ཆེ་བློ་གཏད་འདོན་པ་ལ་སྐད་རིགས་ཀྱི་བྱ་སྤྱོད་དང་Orientation Dialog System GlobalWoZ: Globaliziranje multiWoZ za razvoj sistema dijaloga s orijentacijom višejezičkih zadataka GlobalWoZ: Globalitzar MultiWoZ per desenvolupar sistemes de diàleg multilingües orientats a les tasques GlobalWoZ: Globalizace MultiWoZ za účelem vývoje vícejazyčných dialogových systémů orientovaných na úkoly GlobalWoZ: Globalisering af MultiWoZ til at udvikle flersprogede opgaveorienterede dialogsystemer GlobalWoZ: Globalisierung von MultiWoZ zur Entwicklung mehrsprachiger aufgabenorientierter Dialogsysteme GlobalWoZ: Παγκοσμιοποίηση του MultiWoZ για την ανάπτυξη πολυγλωσσικών συστημάτων διαλόγου προσανατολισμένων στα καθήκοντα GlobalWoz: Globalización de MultiWoz para desarrollar sistemas de diálogo multilingües orientados a tareas GlobalWoZ: MultiWoZ globaliseerumine mitmekeelsete ülesannetele orienteeritud dialoogisüsteemide väljatöötamiseks GlobalWoZ: Globalizing MultiWoZ for Developing Multilingual Task-Oriented Dialogs Systems GlobalWoZ: MultiWoZ globalisoituu monikielisten tehtävälähtöisten vuoropuhelujärjestelmien kehittämiseksi GlobalWOZ : Mondialiser MultiWOZ pour développer des systèmes de dialogue multilingues orientés tâches GlobalWoZ: MultiWoZ a Dhomhandú chun Córais Idirphlé Ilteangacha atá Dírithe ar Thasc a Fhorbairt KCharselect unicode block name GlobalWoZ: MultiWoZ גלובליזציה כדי לפתח מערכות דיאלוג רבות שפויות ממוקדות משימות GlobalWoZ: बहुभाषी कार्य-उन्मुख संवाद प्रणालियों को विकसित करने के लिए बहु-WoZ का वैश्वीकरण GlobalWoZ: Globaliziranje multiWoZ za razvoj sustava razvijanja višejezičkih dijaloga s orijentacijom zadataka GlobalWoZ: A MultiWoZ globalizálása többnyelvű feladatorientált párbeszédrendszerek fejlesztése érdekében Գլոբալ GlobalWoZ: Globalizing MultiWoZ to Develop Multilingual Task-Oriented Dialogue Systems GlobalWoZ: Globalizzare MultiWoZ per sviluppare sistemi di dialogo multilingue orientati alle attività GlobalWoZ :多言語タスク指向の対話システムを開発するためのMultiWoZのグローバル化 Global WoZ: Global WoZ kanggo nggawe MultiWoZ kanggo nggawe Multilengkang task-Oriented Dialog Sistem GlobalWoZ: MultiWoZ გლობალიზაცია მრავალური დავალების განვითარება დიალოგური სისტემები ГлобалWoZ: Көп тілді тапсырмалар бағытталған диалог жүйелерін жасау үшін көп- WoZ глобализациялау Global Woz: 멀티 언어 대화 시스템을 개발하여 멀티 언어 대화 시스템을 글로벌화합니다. GlobalWoZ: Globalizing MultiWoZ to develop Multilingual Task-oriented Dialogue Systems ГлобалWoZ: Глобализирање на мултиWoZ за развој на мултијазички дијалошки системи ориентирани на задачи ഗ്ലോബാള്വോസ്: പല ഭാഷകളുടെ ടാസ്ക്- മൂല്ലിഭാഷക്കുള്ള ഡയലോഗ് സിസ്റ്റത്തിലേക്ക് ഗ്ലോബല് ചെയ്യുന്നു GlobalWoZ: Олон хэлний ажлын ориентиролтын диалог системүүдийг хөгжүүлэхэд GlobalWoZ: Globalizing MultiWoZ to Develop Multilingual Task-Oriented Dialog Systems GlobalWoZ: Globalizing MultiWoZ to Develop Multilingual Task-Oriented Dialogue Systems GlobalWoZ: MultiWoZ globaliseren om meertalige taakgerichte dialoogsystemen te ontwikkelen GlobalWoZ: Globaliserer fleirWoZ for å utvikla dialogsystemar med fleirspråk orientert oppgåver GlobalWoZ: Globalizacja MultiWoZ w celu opracowania wielojęzycznych systemów dialogu zorientowanego na zadania GlobalWoZ: Globalizando o MultiWoZ para desenvolver sistemas de diálogo orientados a tarefas multilíngues GlobalWoZ: Globalizarea MultiWoZ pentru a dezvolta sisteme de dialog multilingve orientate spre sarcini GlobalWoZ: Глобализация MultiWoZ для разработки многоязычных систем диалога, ориентированных на решение конкретных задач GlobalWoZ: ගොලෝබික විශ්වාස කරන්න MultiWoZ ගොලෝබික විශ්වාස කරන්න බොහොම භාෂාත්මක විකාසය කරන්න GlobalWoZ: Globalizacija MultiWoZ za razvoj večjezičnih sistemov dialoga, usmerjenih v naloge GlobalWoZ: GlobalWoZ: Globalizing MultiWoZ to Develop Task-oriented Dialog Systems GlobalWoZ: Globalizing MultiWoZ to Develop Multilingual Task-Oriented Dialogue Systems GlobalWoZ: Globaliziranje multiWoZ za razvoj sistema razvijanja višejezičkih dijaloga s orijentacijom zadataka GlobalWoZ: Globalisera MultiWoZ för att utveckla flerspråkiga uppgiftsorienterade dialogsystem GlobalWoZ: Kutangaza MultiWoZ kuendeleza Mifumo ya Tamko za Kilugha zilizotengenezwa GlobalWoZ: பல மொழிகள் பணி திட்டமைக்கப்பட்ட உரையாடல் அமைப்புகளை உருவாக்குதலுக்கு பல வுஜிஸ் முழுமையாக்குகிறது GlobalWoZ: 횉oklu dilli Ta첵챌a-G체챌li Dialog Sistemlerini geli힊tirmek i챌in 챌oklu WoZ Globalizing MultiWoZ GlobalWoZ: MultiWoZ کو گلوبلائز کرتا ہے multilingual Task-Oriented Dialog Systems GlobalWoZ: MultiWoZ muloqat vazifani taʼminlovchi muloqat tizimi Tổ chức giải pháp vĩ đại GlobalWoZ:全球化多重性,多言
Daniel Hershcovich, Stella Frank, Heather Lent, Miryam de Lhoneux, Mostafa Abdou, Stephanie Brandl, Emanuele Bugliarello, Laura Cabello Piqueras, Ilias Chalkidis, Ruixiang Cui, Constanza Fierro, Katerina Margatina, Phillip Rust, Anders Søgaard
Abstract
Various efforts in the Natural Language Processing (NLP) community have been made to accommodate linguistic diversity and serve speakers of many different languages. However, it is important to acknowledge that speakers and the content they produce and require, vary not just by language, but also by culture. Although language and culture are tightly linked, there are important differences. Analogous to cross-lingual and multilingual NLP, cross-cultural and multicultural NLP considers these differences in order to better serve users of NLP systems. We propose a principled framework to frame these efforts, and survey existing and potential strategies.Abstract
In die laaste paar jaar is daar 'n beweging na data kurasie vir veelvuldige taak-orienteerde dialoog (ToD) stelsels wat mense kan dien wat verskillende tale praat. Maar bestaande multitaalske ToD-datastelle het of 'n beperkte aandekking van tale vanweë die hoë koste van data kurasie, of ignoreer die feit dat dialoog-entiteite skaars bestaan in lande wat hierdie taal praat. Om hierdie beperking te probeer, introduseer ons 'n nuwe data kurasie metode wat globaliseer GlobalWoZ --- ' n groot- skaal multitaalske ToD datastel globaliseer van 'n Engelske ToD datastel vir drie ongeverklare gebruik gevalle van “ multitaalske ToD stelsels. Ons metode is gebaseer op die vertaling van dialoog sjabloane en die vulling van hulle met plaaslike entiteite in die doel- taal lande. Ons verleng die dekking van die doel tale na 20 taal. Ons sal ons datastel en 'n stel sterke basisline verlos om ondersoek op multilinguele ToD stelsels te bevestig vir regte gebruik gevalle.Abstract
ባለፉት ጥቂት ዓመታት፣ ለቋንቋ ቋንቋ-ቋንቋ-ቋንቋ-ቋንቋ-ቋንቋ የሚናገሩትን ሰዎች ለማገልገል የሚችሉትን የዳታ መክፈቻ (ToD) ስርዓቶች ተዘጋጅቷል፡፡ However, existing multilingual ToD datasets either have a limited coverage of languages due to the high cost of data curation, or ignore the fact that dialogue entities barely exist in countries speaking these languages. እነዚህን ግንኙነት ለመቀናቀል፣ የጎልቦልWoZ - በንግግሊዝኛ ToD ዳታተሮች ላይ ለሦስት ያልታወቀ በብልልልቋዊ የጦድ ስርዓት የተለየውን የዳታ ማቀናጃ ማቀናቀል እናስጠጋለን፡፡ የሥርዓታችን አካባቢ ቋንቋ ሀገሮች በማፍለጋት ማህበረሰብ መክፈቻ ላይ ነው፡፡ በተጨማሪም የደረጃ ቋንቋዎችን ወደ 20 ቋንቋ እናስፋታለን፡፡ የዳታ ሳጥን እና የብርቱ መቀመጫዎችን እናሳድጋለን፡፡Abstract
على مدى السنوات القليلة الماضية ، كان هناك تحرك نحو تنظيم البيانات لأنظمة الحوار متعدد اللغات (ToD) التي يمكن أن تخدم الأشخاص الذين يتحدثون لغات مختلفة. ومع ذلك ، فإن مجموعات بيانات ToD الحالية متعددة اللغات إما لها تغطية محدودة للغات بسبب التكلفة العالية لمعالجة البيانات ، أو تتجاهل حقيقة أن كيانات الحوار بالكاد توجد في البلدان التي تتحدث هذه اللغات. لمعالجة هذه القيود ، قدمنا طريقة جديدة لتنظيم البيانات تنشئ GlobalWoZ - مجموعة بيانات ToD متعددة اللغات واسعة النطاق معولمة من مجموعة بيانات ToD الإنجليزية لثلاث حالات استخدام غير مستكشفة لأنظمة ToD متعددة اللغات. تعتمد طريقتنا على ترجمة قوالب الحوار وتعبئتها بالكيانات المحلية في البلدان ذات اللغة المستهدفة. إلى جانب ذلك ، قمنا بتوسيع تغطية اللغات المستهدفة إلى 20 لغة. سنصدر مجموعة البيانات الخاصة بنا ومجموعة من خطوط الأساس القوية لتشجيع البحث عن أنظمة ToD متعددة اللغات لحالات الاستخدام الحقيقي.Abstract
Son bir neçə il içində, çoxlu dil tərəfindən danışan danışma sistemlərinə verilən məlumatların məlumatlarına tərəf gəldi. Halbuki, çox dilli ToD verilən qurbanları məlumatların yüksək qiymətlərinin ucbatından müəyyən edilmiş dillərin örtüsü var, ya da məlumatların bu dillərin danışdığı məlumatların çox az olmadığını unutmayın. Bu limitlərə çəkilmək üçün, GlobalWoZ-dən oluşan yeni məlumat qırma metodlarını təşkil edirik --- çox dilli ToD veri qurğuları İngilizci ToD veri qurğuundan globalizləşdirilmiş üç müfəssəl istifadə edilməmiş və çox dilli ToD sistemlərinin istifadə edilməsi üçün böyük bir çox dilli ToD veri qurğu Bizim metodumuz dini şablonları tercümə etmək və onları məqsəd dil ülkelərində yerli məlumatlarla doldurmaq üçün dayanılır. Əksinə, məqsəd dillərin əhvalatını 20 dilə uzatdıq. Biz verilənlərimizi və çoxlu dilli ToD sistemlərini gerçek istifadə məqsədilə təşkil etmək üçün qüvvətli sətirlərimizi yayınlayacağıq.Abstract
През последните няколко години е настъпил напредък към събиране на данни за многоезични системи за диалог, ориентиран към задачите, които могат да обслужват хора, говорещи различни езици. Съществуващите многоезични набори от данни за ДО обаче или имат ограничено покритие на езиците поради високата цена на събирането на данни, или пренебрегват факта, че структурите за диалог едва съществуват в държавите, говорещи тези езици. За да се справим с тези ограничения, въвеждаме нов метод за коригиране на данни, който генерира мащабен многоезичен набор от данни, глобализиран от английски набор от данни за три неизследвани случая на употреба на многоезични системи. Методът ни се основава на превод на шаблони за диалог и попълване им с местни субекти в страните на целевия език. Освен това разширяваме обхвата на целевите езици на 20 езика. Ние ще публикуваме нашия набор от данни и набор от силни базови линии, за да насърчим изследванията на многоезичните системи за обучение за реални случаи на употреба.Abstract
গত কয়েক বছর ধরে অনেক ভাষায় ভাষায় মানুষকে ভিন্ন ভাষাভাষায় কথোপকথন করতে পারে তথ্য কারাগারের দিকে নিয়ে যাওয়ার জন্য একটি পদক্ষেপ ঘট তবে বিদ্যমান বহুভাষায় টোডি ডাটাসেটের বিভিন্ন ভাষার সীমাবদ্ধ কাভারেজ রয়েছে ডাটা কুরেশনের বেশী খরচের কারণে, অথবা এই বাস্তবতাকে উপেক্ষা করা এই সীমাবদ্ধতার মুখোমুখি হওয়ার জন্য আমরা একটি নভেল ডাটা কুরেশন পদ্ধতি চিহ্নিত করি যা গ্লোবালউজ - একটি বিশাল মাল্টাল ভাষায় বহুভাষী টোডি ডাটাসেট বিশ্ববিদ্যালয় করে একটি ইংর আমাদের পদ্ধতি টার্গেট ভাষার দেশে ডায়ালগের মন্দির অনুবাদ করার উপর ভিত্তিতে এবং তাদের স্থানীয় বস্তুর সাথে পূরণ কর এছাড়াও, আমরা টার্গেট ভাষার কাভারেজ ২০ ভাষায় বাড়িয়ে দেই। আমরা আমাদের ডাটাসেট এবং বেশ কিছু শক্তিশালী বেসেইন মুক্তি দেব যাতে বাস্তবতা ব্যবহারের ক্ষেত্রে বহুভাষায় টোডি সAbstract
འདས་བའི་ལོ་ངོ་ཤས་ཀྱི་རིང་ལ། སྐད་ཡིག་གཟུགས་སྐོར་ལས་ཆ་འཕྲིན་གྱི་བྱ་འགུལ་ལྟ་བུ་ཞིབ་འཇུག་བྱས། ཡིན་ནའང་། སྐད་ཡིག ཚད་འདི་དག་གི་སྤྲོད་ཀྱི་དོན་ལས་མཐུན་བཟོ་བྱས་ན། ང་ཚོས་མཐུན་བཟོ་བརྒྱུད་ལམ་ཞིག་introduce a new data curation method that generates GlobalWoZ --- a large-scale multilingual ToD dataset globalized from an English ToD dataset for three unexplored use cases of multilingual ToD systems. ང་ཚོའི་ཐབས་ལམ་ལུགས་འདིས་སྒྲུབ་ཀྱི་དཔེ་དབྱིབས་ཚུལ འོན་ཀྱང་། ང་ཚོས་དམིགས་ཡུལ་གྱི་སྐད་རིགས་ལ་སྐད་རིགས་༢༠་བར་གཏོང་བྱེད། ང་ཚོས་རང་ཚོའི་སྒྲིག་ཆ་འཕྲིན་དང་མཛུབ་གླིང་སྒྲིག་གཙོ་རིམ་ཅིག་བཏོན་གཏོང་། སྐད་ཡིག་ཆ་གི་ToD་ལག་སྟར་བདAbstract
Tokom poslednjih nekoliko godina, postoji potez prema kuraciji podataka za sisteme dijaloga orijentiranog na multijezičkim zadatkama (ToD) koji mogu služiti ljudima koji govore različite jezike. Međutim, postojeći multijezički podaci o ToD-u ili imaju ograničeni pokrivač jezika zbog visoke troškove kuracije podataka, ili ignoriraju činjenicu da dijalogske entitate jedva postoje u zemljama koje govore ovim jezicima. Za rješavanje tih ograničenja, predstavljamo novu metodu kuracije podataka koji stvara GlobalWoZ -- veliku multijezičku kompletu podataka za ToD globaliziranu iz kompleta podataka engleskog ToD-a za tri neočekivane slučajeve korištenja multijezičkih ToD-a. Naša metoda je bazirana na prevodu šablona dijaloga i ispunjavanju ih lokalnim entitetima u zemljama ciljanog jezika. Osim toga, proširimo pokrivanje ciljnih jezika na 20 jezika. Oslobodit ćemo naš set podataka i skup jakih osnovnih linija za poticanje istraživanja o multijezičkim sistemima ToD-a za stvarne slučajeve upotrebe.Abstract
Durant els darrers anys, ha estat un pas cap a la curació de dades per a sistemes multilingües de diàleg orientat a les tasques (ToD) que poden servir a la gent que parla llengües diferents. Tot i així, els conjunts de dades multilingües existents de ToD tenen una cobertura limitada de llengües a causa del cost elevat de la curació de dades, o ignoren el fet que les entitats de diàleg gairebé existen en països que parlen aquestes llengües. Per enfrontar aquestes limitacions, introduim un nou mètode de curació de dades que genera GlobalWoZ -- un conjunt de dades multilingües ToD a gran escala globalitzat d'un conjunt de dades ToD anglès per tres casos d'ús no explorats de sistemes ToD multilingües. El nostre mètode es basa en traduir models de diàleg i omplir-los amb entitats locals dels països de llenguatge alvo. A més, estendem la cobertura de les llengües alvo a 20 llengües. Vam publicar el nostre conjunt de dades i un conjunt de línies de base fortes per incentivar la recerca sobre sistemes multilingües de ToD per casos d'ús real.Abstract
V posledních několika letech došlo k posunu směrem ke správě dat pro systémy vícejazyčného dialogu orientovaného na úkoly (ToD), které mohou sloužit lidem mluvícím různými jazyky. Stávající vícejazyčné datové sady ToD však buď mají omezené pokrytí jazyků kvůli vysokým nákladům na kuraci dat, nebo ignorují skutečnost, že dialogové subjekty v zemích hovořících těmito jazyky sotva existují. Pro řešení těchto omezení představujeme novou metodu kurace dat, která generuje GlobalWoZ --- rozsáhlý vícejazyčný datový soubor ToD globalizovaný z anglického ToD datového souboru pro tři neprozkoumané případy použití vícejazyčných ToD systémů. Naše metoda je založena na překladu šablon dialogu a jejich vyplnění lokálními subjekty v cílových jazykových zemích. Kromě toho rozšiřujeme pokrytí cílových jazyků na dvacet jazyků. Zveřejníme náš datový soubor a sadu silných základních linií, abychom podpořili výzkum vícejazyčných ToD systémů pro reálné případy použití.Abstract
I løbet af de sidste par år er der sket en bevægelse i retning af datakuration for flersprogede opgaveorienterede dialogsystemer (ToD), der kan betjene mennesker, der taler forskellige sprog. Eksisterende flersprogede ToD-datasæt har imidlertid enten begrænset sprogdækning på grund af de høje omkostninger ved databehandling, eller ignorerer, at dialogenheder knap nok findes i lande, der taler disse sprog. For at tackle disse begrænsninger introducerer vi en ny datakuratmetode, der genererer GlobalWoZ --- et stort flersproget ToD datasæt globaliseret fra et engelsk ToD datasæt til tre uudforskede brugstilfælde af flersprogede ToD systemer. Vores metode er baseret på at oversætte dialogskabeloner og udfylde dem med lokale enheder i målsprogslandene. Desuden udvider vi dækningen af målsprog til 20 sprog. Vi vil frigive vores datasæt og et sæt stærke basislinjer for at fremme forskning i flersprogede ToD-systemer til reelle brugssager.Abstract
In den letzten Jahren hat sich die Datenkuration für mehrsprachige aufgabenorientierte Dialogsysteme (ToD) entwickelt, die Menschen mit unterschiedlichen Sprachen dienen können. Bestehende mehrsprachige ToD-Datensätze haben jedoch aufgrund der hohen Kosten für die Datenkuration entweder eine begrenzte Abdeckung von Sprachen oder ignorieren die Tatsache, dass Dialoge in Ländern, die diese Sprachen sprechen, kaum existieren. Um diesen Einschränkungen entgegenzuwirken, führen wir eine neuartige Datenkuratierungsmethode vor, die GlobalWoZ --- einen großen mehrsprachigen ToD-Datensatz generiert, der aus einem englischen ToD-Datensatz globalisiert wird und für drei unerforschte Anwendungsfälle mehrsprachiger ToD-Systeme verwendet werden kann. Unsere Methode basiert auf der Übersetzung von Dialogvorlagen und deren Befüllung mit lokalen Einheiten in den Zielländern. Außerdem erweitern wir die Abdeckung der Zielsprachen auf 20-Sprachen. Wir werden unseren Datensatz und eine Reihe starker Baselines veröffentlichen, um die Erforschung mehrsprachiger ToD-Systeme für reale Anwendungsfälle zu fördern.Abstract
Τα τελευταία χρόνια, σημειώθηκε μια κίνηση προς την κατεύθυνση της επιμέλειας δεδομένων για πολυγλωσσικά συστήματα διαλόγου προσανατολισμένου στις εργασίες που μπορούν να εξυπηρετήσουν άτομα που μιλούν διαφορετικές γλώσσες. Ωστόσο, τα υπάρχοντα πολύγλωσσα σύνολα δεδομένων ΤΔ είτε έχουν περιορισμένη κάλυψη γλωσσών λόγω του υψηλού κόστους επεξεργασίας δεδομένων, είτε αγνοούν το γεγονός ότι οντότητες διαλόγου ελάχιστα υπάρχουν σε χώρες που μιλούν αυτές τις γλώσσες. Για την αντιμετώπιση αυτών των περιορισμών, εισάγουμε μια νέα μέθοδο επεξεργασίας δεδομένων που παράγει ένα μεγάλης κλίμακας πολύγλωσσο σύνολο δεδομένων που παγκοσμιοποιείται από ένα αγγλικό σύνολο δεδομένων για τρεις ανεξερεύνητες περιπτώσεις χρήσης πολυγλωσσικών συστημάτων. Η μέθοδος μας βασίζεται στη μετάφραση προτύπων διαλόγου και την πλήρωσή τους με τοπικές οντότητες στις χώρες-στόχους. Εξάλλου, επεκτείνουμε την κάλυψη των γλωσσών-στόχων σε είκοσι γλώσσες. Θα απελευθερώσουμε το σύνολο δεδομένων μας και ένα σύνολο ισχυρών βασικών γραμμών για να ενθαρρύνουμε την έρευνα σε πολυγλωσσικά συστήματα για πραγματικές περιπτώσεις χρήσης.Abstract
En los últimos años, se ha avanzado hacia la conservación de datos para sistemas de diálogo orientado a tareas (ToD) multilingües que pueden servir a personas que hablan diferentes idiomas. Sin embargo, los conjuntos de datos ToD multilingües existentes tienen una cobertura limitada de idiomas debido al alto costo de la conservación de datos, o ignoran el hecho de que las entidades de diálogo apenas existen en los países que hablan estos idiomas. Para hacer frente a estas limitaciones, presentamos un novedoso método de conservación de datos que genera GlobalWoz, un conjunto de datos ToD multilingüe a gran escala globalizado a partir de un conjunto de datos ToD en inglés para tres casos de uso inexplorados de sistemas ToD multilingües. Nuestro método se basa en traducir plantillas de diálogo y rellenarlas con entidades locales en los países del idioma de destino. Además, ampliamos la cobertura de los idiomas de destino a 20 idiomas. Publicaremos nuestro conjunto de datos y un conjunto de bases sólidas para fomentar la investigación sobre sistemas ToD multilingües para casos de uso reales.Abstract
Viimastel aastatel on liikutud andmete kureerimise suunas mitmekeelsete ülesannetele orienteeritud dialoogi süsteemide jaoks, mis võivad teenindada erinevaid keeli rääkivaid inimesi. Siiski on olemasolevatel mitmekeelsetel tööalase dokumendi andmekogumitel andmete kureerimise kõrge maksumuse tõttu piiratud keelte katvus või ignoreeritakse asjaolu, et neid keeli rääkivates riikides on dialoogiüksused vaevalt olemas. Nende piirangute kõrvaldamiseks tutvustame uudset andmete kureerimise meetodit, mis genereerib GlobalWoZ -- suure mitmekeelse ToD andmekogumi, mis on globaliseeritud inglise ToD andmekogumist kolme uurimata kasutusjuhtumi mitmekeelsete ToD süsteemide jaoks. Meie meetod põhineb dialoogimallide tõlkimisel ja nende täitmisel sihtkeele riikide kohalike üksustega. Lisaks laiendame sihtkeelte katvust 20 keelele. Avaldame oma andmekogumi ja tugevad lähtejooned, et julgustada teadusuuringuid mitmekeelsete ToD süsteemide kohta reaalsete kasutusjuhtumite puhul.Abstract
در طول چند سال گذشته، یک حرکت به سمت مرحله دادهها برای سیستمهای مطالعهای که میتوانند به مردم خدمت کنند که زبانهای مختلف صحبت کنند. با این حال، مجموعههای دادههای ToD زیادی زبانها یا زبانهای محدودیت دارند به دلیل هزینههای زیادی از کورش دادهها، یا حقیقت را نادیده بگیرند که مجموعههای گفتگو در کشورها سخت در این زبانها وجود دارند. برای حل این محدودیت، ما یک روش کنترل داده های نو را معرفی می کنیم که GlobalWoZ را تولید می کند -- یک مجموعه داده های زیادی زبان ToD globalized از یک مجموعه داده های ToD انگلیسی برای سه پروندههای استفاده از سیستمهای ToD multilingual. روش ما بر اساس ترجمه کردن قالبهای گفتگو و پر کردن آنها با واحدهای محلی در کشورهای زبان هدف است. علاوه بر این، ما پوشش زبانهای هدف را به ۲۰ زبان گسترش می دهیم. ما مجموعهی دادهها و مجموعهی خطهای پایگاههای قوی را برای تحقیقات در سیستمهای ToD multilingual برای پروندههای واقعی استفاده میکنیم.Abstract
Viime vuosina on siirrytty kohti datan kuratointia monikielisille tehtävälähtöisille dialogijärjestelmille, jotka voivat palvella eri kieliä puhuvia ihmisiä. Nykyisissä monikielisissä ToD-tietoaineistoissa on kuitenkin joko rajoitettu kielikattavuus tietojen keruun korkeiden kustannusten vuoksi, tai sivuutetaan se, että näitä kieliä puhuvissa maissa on tuskin olemassa vuoropuheluyksiköitä. Näiden rajoitusten poistamiseksi esittelemme uuden datan kuratointimenetelmän, joka luo GlobalWoZ: n – suuren mittakaavan monikielisen ToD-aineiston, joka on globalisoitu englanninkielisestä ToD-aineistosta kolmeen tutkimattomaan monikielisten ToD-järjestelmien käyttötapaukseen. Menetelmämme perustuu vuoropuhelumallien kääntämiseen ja niiden täyttämiseen kohdemaiden paikallisyhteisöillä. Lisäksi laajennamme kohdekielten kattavuutta 20 kieleen. Julkaisemme aineistomme ja vahvat lähtökohdat kannustaaksemme monikielisten ToD-järjestelmien tutkimusta todellisissa käyttötapauksissa.Abstract
Au cours des dernières années, il y a eu une évolution vers la conservation des données pour les systèmes de dialogue orienté sur les tâches (ToD) multilingues pouvant servir des personnes parlant différentes langues. Cependant, les ensembles de données TdD multilingues existants ont une couverture linguistique limitée en raison du coût élevé de la conservation des données, ou ignorent le fait que les entités de dialogue existent peu dans les pays parlant ces langues. Pour pallier ces limites, nous introduisons une nouvelle méthode de conservation des données qui génère GlobalWoz, un jeu de données ToD multilingue à grande échelle globalisé à partir d'un jeu de données ToD anglais pour trois cas d'utilisation inexplorés de systèmes de ToD multilingues. Notre méthode est basée sur la traduction de modèles de dialogue et leur remplissage avec des entités locales dans les pays de la langue cible. En outre, nous étendons la couverture des langues cibles à 20 langues. Nous publierons notre ensemble de données et un ensemble de bases de référence solides pour encourager la recherche sur les systèmes de TdD multilingues pour des cas d'utilisation réels.Abstract
Le blianta beaga anuas, tá bogadh i dtreo coimeád sonraí do chórais ilteangacha idirphlé tasc-dhírithe (TOD) ar féidir leo freastal ar dhaoine a labhraíonn teangacha éagsúla. Mar sin féin, tá clúdach teoranta teangacha ag tacair sonraí TOD ilteangacha atá ann cheana mar gheall ar an gcostas ard a bhaineann le coimeád sonraí, nó déanann neamhaird den fhíric gur ar éigean a bhíonn eintitis idirphlé i dtíortha ina labhraítear na teangacha sin. Chun dul i ngleic leis na teorainneacha seo, tugaimid isteach modh leasaithe sonraí nua a ghineann GlobalWoZ --- tacar sonraí ilteangach ToD ar scála mór domhandaithe ó thacar sonraí Béarla ToD do thrí chás úsáide neamh-iniúchta de chórais ilteangacha TD. Tá ár modh bunaithe ar theimpléid dialóige a aistriú agus iad a líonadh le haonáin áitiúla sna tíortha sprioctheanga. Ina theannta sin, leathnaímid clúdach na sprioctheanga go 20 teanga. Eiseoidh muid ár dtacar sonraí agus sraith bonnlínte láidre chun taighde a spreagadh ar chórais ilteangacha TD do chásanna úsáide fíor.Abstract
Daga ƙidãyar shẽkar da suka shige, an sami wata motsi zuwa tsarin data wa zauren akwatin zauren akwatin bayani na mulki-aiki (ToD) wanda ke iya amfani da mutane da ke faɗi lugha daban-daban. A lokacin da, tsarin mutane na mulki-lingui na ToD ko sun ƙunsa da tsarin harshen, ko kuma don ka ƙyale da gaskiyar zauren akwatin bayani na nan da ake faɗa lugha nan. Ko haɗi da waɗannan tsararin, za mu introduce wata hanyor tsarin data na nowaya wanda ke ƙara ga GobalWoZ--- tsarin data mai girma da mulki-lingui'in ToD wanda aka yi globalisa daga data na Ingiriya ToD na daidaita wa 'yan'uwan na'ura da ba'a yi buƙata ba. Tsarin mu na ɗauki a kan fassarar misãlai na zauren akwatin zauren akwatin bayani da kuma yana cika su da abubuwa masu lokaci cikin ƙasan-harshe na ƙayyade. Ina faɗa, za'a shimfiɗa kalmõmin da aka yi amfani da shi zuwa harshen 20. Za mu sakar da tsarin danganmu da wasu misãlai mai ƙarfi dõmin mu yi ƙaramako ga fitina na'ura na'ura-wasu na'ura wa masu amfani da masu gaskiya.Abstract
במהלך השנים האחרונות, היתה התקדמות לכיוון טיפול נתונים למערכות דיאלוג מורכבות לשפות רבות (ToD) שיכולות לשרת אנשים מדברים שפות שונות. בכל אופן, קבוצות נתונים ToD רבות שפות קיימות או יש כיסוי מוגבל של שפות בגלל העלות הגבוהה של טיפול נתונים, או להתעלם מהעובדה שליחידות דיאלוג בקושי קיימות במדינות מדברות שפות אלה. כדי להתמודד עם המגבלות האלה, אנחנו מכירים שיטת טיפול נתונים חדשה שמוצרת גלובלוווז -- קבוצת נתונים ToD רבות-שפותית גדולה השיטה שלנו מבוססת על תרגום דוגמני דיאלוג וממלא אותם עם יחידות מקומיות במדינות שפת המטרה. חוץ מזה, אנחנו ממשיכים את הכיסוי של שפות המטרה ל-20 שפות. אנחנו נפרסם את קבוצת המידע שלנו וערכת קווי בסיס חזקים כדי לעודד מחקר על מערכות ToD רבות שפות למקרים שימוש אמיתי.Abstract
पिछले कुछ वर्षों में, बहुभाषी कार्य-उन्मुख संवाद (टीओडी) प्रणालियों के लिए डेटा क्यूरेशन की दिशा में एक कदम उठाया गया है जो विभिन्न भाषाओं को बोलने वाले लोगों की सेवा कर सकते हैं। हालांकि, मौजूदा बहुभाषी टीओडी डेटासेट में या तो डेटा क्यूरेशन की उच्च लागत के कारण भाषाओं का सीमित कवरेज होता है, या इस तथ्य को अनदेखा किया जाता है कि इन भाषाओं को बोलने वाले देशों में संवाद संस्थाएं मुश्किल से मौजूद हैं। इन सीमाओं से निपटने के लिए, हम एक उपन्यास डेटा क्यूरेशन विधि पेश करते हैं जो GlobalWoZ को एक बड़े पैमाने पर बहुभाषी टीओडी डेटासेट के --- में उत्पन्न करता है जो बहुभाषी टीओडी सिस्टम के तीन अनपेक्षित उपयोग मामलों के लिए एक अंग्रेजी टीओडी डेटासेट से वैश्वीकृत होता है। हमारी विधि संवाद टेम्पलेट्स का अनुवाद करने और उन्हें लक्ष्य-भाषा देशों में स्थानीय संस्थाओं के साथ भरने पर आधारित है। इसके अलावा, हम 20 भाषाओं के लिए लक्षित भाषाओं के कवरेज का विस्तार करते हैं। हम वास्तविक उपयोग के मामलों के लिए बहुभाषी टीओडी सिस्टम पर शोध को प्रोत्साहित करने के लिए अपने डेटासेट और मजबूत बेसलाइन का एक सेट जारी करेंगे।Abstract
Tokom posljednjih nekoliko godina, postoji potez prema usmjerenju podataka za sisteme dijaloga orijentiranog na višejezičkim zadatkama (ToD) koji mogu služiti ljudima koji govore različite jezike. Međutim, postojeći multijezički podaci o ToD-u ili imaju ograničeni pokrivač jezika zbog visoke troškove kuracije podataka, ili ignoriraju činjenicu da dijalogske subjekte jedva postoje u zemljama koje govore ovim jezicima. Za rješavanje tih ograničenja, predstavljamo novu metodu korištenja podataka koji stvara GlobalWoZ -- veliku višejezičku kompletu podataka za ToD globaliziranu iz kompleta podataka engleskog ToD-a za tri neobjašnjene korištenje slučajeva višejezičkih ToD-a. Naša metoda je temeljena na prevodu šablona dijaloga i ispunjavanju ih lokalnim entitetima u zemljama ciljnog jezika. Osim toga, proširimo pokrivanje ciljnih jezika na 20 jezika. Oslobodit ćemo naš set podataka i skup jakih osnovnih linija za poticanje istraživanja o multijezičkim sustavima ToD-a za stvarne slučajeve upotrebe.Abstract
Az elmúlt néhány évben a többnyelvű feladatorientált párbeszéd (ToD) rendszerek adatgyűjtése irányába történt, amelyek különböző nyelveket beszélők számára képesek kiszolgálni. A meglévő, többnyelvű ToD-adatkészletek azonban vagy korlátozott nyelvű lefedettséggel rendelkeznek az adatkezelés magas költségei miatt, vagy figyelmen kívül hagyják azt a tényt, hogy a párbeszéd szervezetek alig léteznek ezeket a nyelveket beszélő országokban. Ezeknek a korlátozásoknak a leküzdése érdekében bevezetünk egy új adatkezelési módszert, amely létrehozza a GlobalWoZ --- egy nagyszabású, többnyelvű ToD adatkészletet, amely egy angol ToD adatkészletből globalizálódik, három, többnyelvű ToD rendszer feltáratlan felhasználási esetében. Módszerünk a párbeszédsablonok fordításán és a célnyelvű országok helyi szervezeteivel való kitöltésén alapul. Emellett a célnyelvek lefedettségét 20 nyelvre bővítjük. Adatkészletünket és egy sor erős alapkészletünket is kiadjuk, hogy ösztönözzük a többnyelvű ToD rendszerekkel kapcsolatos kutatásokat valós használati esetekben.Abstract
Վերջին մի քանի տարիների ընթացքում տեղի է ունեցել մի քայլ դեպի տվյալների կառուցվածք բազմալեզու խնդիրների վրա ուղղությամբ խոսակցած համակարգերի համար, որոնք կարող են ծառայել մարդկանց, ովքեր տարբեր լեզուներ են խոսու Այնուամենայնիվ, գոյություն ունեցող բազմալեզու ToD տվյալների համակարգերը կամ ունեն լեզուների սահմանափակ ծախսեր տվյալների վերականգնման բարձր արժեքի պատճառով, կամ անտեսեք այն փաստը, որ երկրներում, որոնք այս լեզուներն են խոսում, հազիվ Այս սահմանափակումները լուծելու համար մենք ներկայացնում ենք նոր տվյալների կարգավորման մեթոդ, որը ստեղծում է Գլոբալ Վոզ, մի մեծ բազլեզու ToD տվյալների համակարգ, որը գլոբալիզացված է անգլերեն ToD տվյալների համակարգից երեք անուսումնասիրելի օգտագործման դեպքերի համար: Our method is based on translating dialogue templates and filling them with local entities in the target-language countries. Ավելին, մենք ընդլայնում ենք նպատակային լեզուների ծավալը մինչև 20 լեզու: Մենք կհրապարակենք մեր տվյալների համակարգը և ուժեղ հիմքերի համակարգը, որպեսզի խրախուսենք բազմալեզու ToD համակարգերի ուսումնասիրությունը իրական օգտագործման դեպքերում:Abstract
Selama beberapa tahun terakhir, ada langkah menuju kurasi data untuk sistem dialog berbagai bahasa yang mengarientasi tugas (ToD) yang dapat melayani orang berbicara bahasa yang berbeda. Namun, dataset ToD berbagai bahasa yang ada sama ada memiliki perlindungan terbatas bahasa karena biaya tinggi penyerahan data, atau mengabaikan fakta bahwa entitas dialog hampir tidak ada di negara yang berbicara bahasa-bahasa ini. Untuk mengatasi batasan-batasan ini, kami memperkenalkan metode curasi data yang baru yang menghasilkan GlobalWoZ -- sebuah set data ToD berbagai bahasa besar yang globalisasi dari set data ToD Inggris untuk tiga kasus penggunaan tidak dikenalpasti dari sistem ToD berbagai bahasa. Metode kami berdasarkan menerjemahkan templat dialog dan mengisi mereka dengan entitas lokal di negara-negara bahasa sasaran. Selain itu, kita memperluas penutupan bahasa sasaran ke 20 bahasa. Kami akan melepaskan dataset kami dan set garis dasar yang kuat untuk mendorong penelitian tentang sistem ToD berbagai bahasa untuk kasus penggunaan nyata.Abstract
Negli ultimi anni, si è passati alla cura dei dati per sistemi di dialogo multilingue orientato ai compiti (ToD) che possono servire persone che parlano lingue diverse. Tuttavia, i set di dati multilingui esistenti sulle ToD hanno una copertura limitata delle lingue a causa dell'elevato costo della gestione dei dati, o ignorano il fatto che le entità di dialogo esistono a malapena nei paesi che parlano queste lingue. Per affrontare queste limitazioni, introduciamo un nuovo metodo di cura dei dati che genera GlobalWoZ --- un set di dati ToD multilingue su larga scala globalizzato da un set di dati ToD inglese per tre casi d'uso inesplorati di sistemi ToD multilingue. Il nostro metodo si basa sulla traduzione di modelli di dialogo e sulla loro compilazione con entità locali nei paesi della lingua di destinazione. Inoltre, estendiamo la copertura delle lingue di destinazione a 20 lingue. Rilasceremo il nostro set di dati e una serie di solide linee di base per incoraggiare la ricerca su sistemi multilingue ToD per casi d'uso reali.Abstract
ここ数年、さまざまな言語を話す人々に役立つ多言語タスク指向対話( ToD )システムのためのデータキュレーションへの動きがありました。しかし、既存の多言語ToDデータセットは、データキュレーションのコストが高いために言語のカバレッジが限られているか、または対話エンティティがこれらの言語を話す国にほとんど存在しないという事実を無視しています。これらの限界に対処するために、私たちはGlobalWoZを生成する新しいデータキュレーション方法を導入しました。GlobalWoZは、英語のToDデータセットからグローバル化された大規模な多言語ToDデータセットで、多言語ToDシステムの3つの未調査のユースケースを生成します。当社の方法は、ダイアログテンプレートを翻訳し、ターゲット言語の国の現地のエンティティで埋めることに基づいています。さらに、対象言語のカバレッジを20言語に拡大しました。データセットと一連の強力なベースラインをリリースし、実際のユースケースのための多言語ToDシステムの研究を奨励します。Abstract
Eror kanggo tekan anyar sampeyan, durung nggawe data curation kanggo sistem sing dadi nggawe langkung task-Oriented (ToD) sistem sing bisa dianggo populer sampeyan uga. politenessoffpolite"), and when there is a change ("assertivepoliteness kanggo nambah perusahaan iki, kita mulai nggawe sistem dadi nggawe dolanan ingkang dolanan dadi sing bisa nggawe Global alWoZ --- un akeh-scale multilanguage ToD dataset global method Inga mbengok, kéné iso nglanggar aturan kanggo kalaman luwih dumadhi kanggo awak dhéwé. Awak dhéwé bakal ngembukaké dataset nganggo sistem sing paling nggawe gerakan kanggo nguasai pergambar barang kanggo sistem ToD sing paling dhéwé.Abstract
ბოლო რამდენიმე წლის განმავლობაში მონაცემების კურაციაზე მოვლენა მრავალური დავალების დიალოგის (ToD) სისტემებისთვის, რომლებიც ადამიანებს განსხვავებული ენების საუბროს შე მაგრამ მრავალენგური ToD მონაცემების კურაციის უფრო დიალოგური კურაციის გამოსახულებლად, ან არ იგნონონონეთ ფაქტი, რომ დიალოგური ინტერტიები მხოლოდ არსებობს ამ ენების ქვე ჩვენ შევცვალოთ ეს ზომილებების შესახებ, რომელიც GlobalWoZ-ს შექმნის პრომენტი მონაცემების კურაციის მეტი, რომელიც დიდი მრავალური ToD მონაცემების კონფიგურაციის კონფიგურაცია გლობალურად ინგლისური ToD მონაც ჩვენი მეთოდი დიალოგის შაბლონებზე დაბაზიან და ისინი ლოკალური ინტერტიკებით მიზეზი ენის ქვეყნებში. დამატებით, ჩვენ მინიშვნელოვანი ენების კონფიგურაციას 20 ენაზე გავაზრუნეთ. ჩვენ ჩვენი მონაცემები და ძალიან ძალიან ბაზონული ხაზები გახსნა, რომ მრავალენგური ToD სისტემების გამოყენება რეალური გამოყენება.Abstract
Соңғы бірнеше жылдар бойынша, көптілік тапсырмалар бағытталған диалог (ТоD) жүйелерінің деректер меңзеріне ауысу болды. Бірнеше тілдерді сөйлейтін адамдарға көмектесе алады. Бірақ бірнеше тілді ToD деректер жиындарында деректер меңзерінің жоғары мәселелерін шектелген тілдер бар немесе бұл тілдерді сөйлейтін елдерде диалог жағдайларын елемейді. Бұл шектерді шектеу үшін біз GlobalWoZ- ды жасайтын жаңа деректерді меңзету әдісін таңдаймыз. Бұл үш тілді ToD деректер жинағынан жалғастырылған үлкен тілді ToD деректер жинағынан жасалған үлкен тілді ToD жүйелерін қолдану үшін Біздің әдіміміз диалог үлгілерін аударып, оларды мақсатты тілдер елдерінде жергілікті нысандармен толтыруға негізделген. Қосымша, біз мақсатты тілдерді 20 тілдерге аударамыз. Біз деректер қорларымызды және бірнеше негізгі жолдарды бірнеше тілді ToD жүйелерін зерттеу үшін шындық пайдалану үшін зерттеуді көмектесеміз.Abstract
지난 몇 년 동안 다중 언어 임무 가이드 대화(ToD) 시스템의 데이터 정리가 트렌드였는데, 이 시스템은 서로 다른 언어를 말하는 사람에게 서비스를 제공할 수 있다.그러나 기존의 다중 언어인 Tod 데이터 세트는 데이터 정리의 높은 비용으로 인해 언어의 범위가 제한되거나 이러한 언어를 사용하는 국가에 대화 실체가 거의 존재하지 않는다는 사실을 무시했다.이러한 한계를 해결하기 위해 우리는 새로운 데이터 정리 방법을 도입하여 글로벌 WoZ-영어 Tod 데이터 집합에서 글로벌화된 대규모 다언어 Tod 데이터 집합을 생성했다. 다언어 Tod 시스템의 세 가지 미개발 용례에 사용된다.우리의 방법은 번역 대화 템플릿을 바탕으로 목표 언어 국가의 현지 실체로 그것들을 채운다.그 밖에 우리는 목표 언어의 범위를 20개 언어로 확대할 것이다.우리는 실제 용례에 대한 다중 언어 ToD 시스템에 대한 연구를 장려하기 위해 우리의 데이터 집합과 강력한 기선을 발표할 것이다.Abstract
Per pastaruosius kelerius metus buvo žengtas žingsnis duomenų tvarkymo link daugiakalbių į užduotis orientuotų dialogo sistemų, kurios gali tarnauti žmonėms, kalbantiems skirtingas kalbas. Tačiau esami daugiakalbiai ToD duomenų rinkiniai dėl didelių duomenų apdorojimo sąnaudų arba ignoruoja tai, kad šiomis kalbomis kalbančiose šalyse vos egzistuoja dialogo subjektai. Siekiant išspręsti šiuos apribojimus, įvedame naują duomenų tvarkymo metodą, kuris sukuria GlobalWoZ -- didelio masto daugiakalbį ToD duomenų rinkinį, globalizuotą iš anglų ToD duomenų rinkinio trims nenagrinėtiems daugiakalbių ToD sistemų naudojimo atvejams. Mūsų metodas grindžiamas dialogo šablonų vertimu ir jų užpildymu vietos subjektais tikslinės kalbos šalyse. Be to, mes išplečiame tikslinių kalbų aprėptį iki 20 kalbų. We will release our dataset and a set of strong baselines to encourage research on multilingual ToD systems for real use cases.Abstract
Во текот на изминатите неколку години, постоеше потег кон курација на податоци за мултијазични дијалозирани системи (ToD) кои можат да служат на луѓето кои зборуваат различни јазици. Сепак, постојните мултијазични тоD податоци или имаат ограничено покривање на јазиците поради високите цени на корекцијата на податоците, или го игнорираат фактот дека ентитетите на дијалогот едвај постојат во земјите кои зборуваат овие јазици. За да ги решиме овие ограничувања, воведуваме нов метод за курација на податоци кој генерира ГлобалВуз -- голем мултијазичен тоD податок глобализиран од англиски тоD податок за три неиспитани случаи на употреба на „ мултијазични тоD системи“. Нашиот метод е базиран на преведување на шаблони за дијалог и исполнување на нив со локални ентитети во земјите на јазикот на целта. Освен тоа, го прошируваме покривањето на јазиците на мета на 20 јазици. Ќе ги објавиме нашите податоци и сет силни основни линии за охрабрување на истражувањето на мултијазичните тоD системи за вистински случаи на употреба.Abstract
കഴിഞ്ഞ കുറച്ച് വര്ഷങ്ങളില്, പല ഭാഷക്കാരുടെ ജോലിക്കുള്ള സംവിധാനങ്ങള് എന്നാലും നിലവിലുള്ള പല ഭാഷ ടോഡി ഡാറ്റാസറ്റുകള് ഈ ഭാഷകള് സംസാരിക്കുന്ന രാജ്യങ്ങളില് സംസാരിക്കുന്ന സംസാരിക്കുന്നതിനാല് ഭാഷകളുടെ ഈ പരിധികളെ എതിര്ത്തെടുക്കാന് വേണ്ടി, ഗ്ലോബാല്വോസ് സിസ്റ്റമില് നിന്നും ഒരു നോവല് ഡേറ്റാ കറഷന് രീതിയില് നാം പരിചയപ്പെടുത്തുന്നു. അത് ഗ്ലോബാല്വോസ് സൃഷ്ടിക്കുന നമ്മുടെ രീതിയില് സംസാരിക്കുന്ന ഡയലോഗ് മാതൃകങ്ങള് പരിഭാഷപ്പെടുത്തുകയും ലക്ഷ്യഭാഷ രാജ്യങ്ങളില് സ്ഥാനമാ Besides, we extend the coverage of target languages to 20 languages. ഞങ്ങള് നമ്മുടെ ഡാറ്റാസസെറ്റും ബലമുള്ള ബേസ്ലെയിനുകളും പുറപ്പെടുത്തും... ...പല ഭാഷകങ്ങളുടെ ടോഡി സിസ്റ്റമുകളിലAbstract
Сүүлийн хэдэн жилийн хугацаанд олон хэлний даалгавартай диалог (ToD) системийн мэдээллийн хөгжлийн хөдөлгөөнд оролцсон. Гэхдээ олон хэлний ToD өгөгдлийн сангууд нь өгөгдлийн хөгжлийн үнэ цэнэтэй болохоор хэлний мэдээллийг хязгаарлагддаг, эсвэл улс орнуудад эдгээр хэлний яриаг хэлэхдээ хэт ч байхгүй байдгийг анзаарах юм. Эдгээр хязгаарлалуудыг зогсоохын тулд бид GlobalWoZ-г олон хэлний ToD өгөгдлийн санг англи ToD өгөгдлийн санаас дэлхийлэгдсэн гурван тайлбаргүй олон хэлний ToD системийн хэрэглээний тухай шинэ өгөгдлийн хөгжүүлэх аргыг тайлбарлаж байна. Бидний арга бол диалог шалгалтыг орлуулж, зорилготой хэлний орнуудын орон нутгийн байгууллагуудыг дүүргэж байгаа. Үүнээс гадна бид зориулагдсан хэл дээр 20 хэл хүртэл нэмэгдүүлнэ. Бид өгөгдлийн санг, үнэндээ хэрэглэгдэх тохиромжтой олон хэлний ToD системийн судалгааг дэмжихийн тулд хүчтэй суурь шугам гаргах болно.Abstract
Over the last few years, there has been a move towards data curation for multilingual task-oriented dialogue (ToD) systems that can serve people speaking different languages. However, existing multilingual ToD datasets either have a limited coverage of languages due to the high cost of data curation, or ignore the fact that dialogue entities barely exist in countries speaking these languages. Untuk mengatasi keterangan-keterangan ini, kami memperkenalkan kaedah penyerahan data yang baru yang menghasilkan GlobalWoZ -- set data ToD berbagai bahasa besar yang globalisasi dari set data ToD Inggeris untuk tiga kes penggunaan tidak dikenalpasti dari sistem ToD berbagai bahasa. Kaedah kami berdasarkan menerjemahkan templat dialog dan mengisi dengan entiti setempat di negara-bahasa sasaran. Selain itu, kita memperluas penutupan bahasa sasaran ke 20 bahasa. Kami akan melepaskan set data kami dan set garis dasar yang kuat untuk mendorong penyelidikan sistem ToD berbilang bahasa untuk kes penggunaan sebenar.Abstract
Matul dawn l-a ħħar snin, kien hemm pass lejn il-kurazzjoni tad-dejta għal sistemi ta’ djalogu multilingwi orjentati lejn ix-xogħol (ToD) li jistgħu jservu lil nies li jitkellmu lingwi differenti. Madankollu, settijiet ta’ dejta eżistenti multilingwi ToD jew għandhom kopertura limitata ta’ lingwi minħabba l-ispiża għolja tal-kurazzjoni tad-dejta, jew jinjoraw il-fatt li entitajiet ta’ djalogu bilkemm jeżistu f’pajjiżi li jitkellmu dawn il-lingwi. Biex nindirizzaw dawn il-limitazzjonijiet, a ħna nintroduċu metodu ġdid ta » kurazzjoni tad-dejta li jiġġenera GlobalWoZ --- sett ta » dejta multilingwi ToD fuq skala kbira globalizzat minn sett ta » dejta Ingliż ToD għal tliet każijiet ta » użu mhux esplorat ta » sistemi ToD multilingwi. Il-metodu tagħna huwa bbażat fuq it-traduzzjoni tal-mudelli tad-djalogu u l-mili tagħhom b’entitajiet lokali fil-pajjiżi fil-lingwa fil-mira. Barra minn hekk, jestendu l-kopertura tal-lingwi fil-mira għal 20 lingwa. Ser nirrilaxxaw is-sett tad-dejta tagħna u sett ta' linji bażi b'saħħithom biex inħeġġu r-riċerka dwar sistemi multilingwi ta' ToD għal każijiet ta' użu reali.Abstract
De afgelopen jaren is er een stap naar datacuratie voor meertalige task-oriented dialogsystemen (ToD) die mensen die verschillende talen spreken, kunnen bedienen. Bestaande meertalige ToD-datasets hebben echter een beperkte dekking van talen vanwege de hoge kosten van gegevenscuratie, of negeren het feit dat dialoogentiteiten nauwelijks bestaan in landen die deze talen spreken. Om deze beperkingen aan te pakken, introduceren we een nieuwe data curation methode die GlobalWoZ --- genereert een grootschalige meertalige ToD dataset geglobaliseerd uit een Engelse ToD dataset voor drie onontdekte use cases van meertalige ToD systemen. Onze methode is gebaseerd op het vertalen van dialogsjablonen en het vullen ervan met lokale entiteiten in de doeltaallanden. Daarnaast breiden we de dekking van doeltalen uit naar 20-talen. We zullen onze dataset en een reeks sterke basislijnen vrijgeven om onderzoek naar meertalige ToD-systemen voor echte use cases aan te moedigen.Abstract
I løpet av dei siste få år har det oppstått ein trekk mot datakursing for fleirspråk oppgåveorientert dialogvindauge (ToD) som kan gjere folk som snakkar ulike språk. Det finst imidlertid fleirspråk ToD-dataset har enten ein begrenset omdekking av språk på grunn av høg kostnad for datakurering, eller ignorerer faktum at dialogeiningar berre finst i landene som snakkar desse språka. For å løse disse grensene, introduserer vi ein nytt datakursisjonsmetode som lager GlobalWoZ -- ein stor multispråk ToD- dataset globalisert frå ein engelsk ToD- dataset for tre utforska bruk av fleirspråk ToD- systemer. Metoden vårt er basert på omsetjingsmalar i dialogvindauget og fyller dei med lokale einingar i målsprakklandene. I tillegg utvidar vi omslaget av målspråk til 20 språk. Vi vil løysa datasettet våre og eit sett sterke baselinjer for å oppfordre forskning på fleirspråk ToD-systemet for verkeleg bruk.Abstract
W ciągu ostatnich kilku lat nastąpiło przejście w kierunku kuracji danych dla wielojęzycznych systemów dialogu zorientowanego na zadania (ToD), które mogą służyć osobom posługującym się różnymi językami. Jednakże istniejące wielojęzyczne zbiory danych dotyczących ToD mają ograniczony zakres języków ze względu na wysokie koszty kuracji danych lub ignorują fakt, że podmioty dialogu ledwo istnieją w krajach posługujących się tymi językami. Aby rozwiązać te ograniczenia, wprowadzamy nową metodę kuracji danych, która generuje GlobalWoZ --- wielojęzyczny zestaw danych ToD zglobalizowany z angielskiego zbioru danych ToD dla trzech niezbadanych przypadków zastosowania wielojęzycznych systemów ToD. Nasza metoda opiera się na tłumaczeniu szablonów dialogu i wypełnianiu ich lokalnymi podmiotami w krajach języka docelowego. Poza tym rozszerzamy zakres języków docelowych na 20-języki. Udostępnimy nasz zestaw danych oraz zestaw silnych linii bazowych, aby zachęcić do badań nad wielojęzycznymi systemami ToD dla realnych przypadków użytku.Abstract
Nos últimos anos, houve um movimento em direção à curadoria de dados para sistemas multilíngues de diálogo orientado a tarefas (ToD) que podem atender pessoas que falam diferentes idiomas. No entanto, os conjuntos de dados multilíngues existentes de ToD têm uma cobertura limitada de idiomas devido ao alto custo da curadoria de dados ou ignoram o fato de que as entidades de diálogo mal existem nos países que falam esses idiomas. Para lidar com essas limitações, apresentamos um novo método de curadoria de dados que gera GlobalWoZ --- um conjunto de dados ToD multilíngue em grande escala globalizado a partir de um conjunto de dados ToD em inglês para três casos de uso inexplorados de sistemas ToD multilíngues. Nosso método se baseia em traduzir modelos de diálogo e preenchê-los com entidades locais nos países de língua-alvo. Além disso, estendemos a cobertura de idiomas de destino para 20 idiomas. Lançaremos nosso conjunto de dados e um conjunto de linhas de base sólidas para incentivar a pesquisa em sistemas ToD multilíngues para casos de uso reais.Abstract
În ultimii ani, s-a înregistrat o evoluție către prelucrarea datelor pentru sistemele de dialog multilingv orientat spre sarcini (ToD), care pot servi persoanele care vorbesc limbi diferite. Cu toate acestea, seturile de date multilingve existente privind dezvoltarea datelor fie au o acoperire limitată a limbilor din cauza costurilor ridicate ale prelucrării datelor, fie ignoră faptul că entitățile de dialog abia există în țările care vorbesc aceste limbi. Pentru a aborda aceste limitări, introducem o metodă nouă de prelucrare a datelor care generează GlobalWoZ --- un set de date ToD multilingv la scară largă globalizat dintr-un set de date ToD în limba engleză pentru trei cazuri neexplorate de utilizare a sistemelor ToD multilingve. Metoda noastră se bazează pe traducerea șabloanelor de dialog și completarea acestora cu entități locale din țările din limba țintă. În plus, extindem acoperirea limbilor ţintă la 20 de limbi. Vom lansa setul nostru de date și un set de linii de referință puternice pentru a încuraja cercetarea privind sistemele multilingve ToD pentru cazuri de utilizare reale.Abstract
За последние несколько лет наметился сдвиг в направлении сбора данных для многоязычных систем ориентированного на решение конкретных задач диалога (ToD), которые могут обслуживать людей, говорящих на различных языках. Однако существующие многоязычные наборы данных ToD либо имеют ограниченный охват языков из-за высокой стоимости обработки данных, либо игнорируют тот факт, что диалоговые структуры едва существуют в странах, говорящих на этих языках. Для устранения этих ограничений мы внедряем новый метод курирования данных, который генерирует GlobalWoZ --- крупномасштабный многоязычный набор данных ToD, глобализованный из английского набора данных ToD для трех неисследованных вариантов использования многоязычных систем ToD. Наш метод основан на переводе шаблонов диалогов и заполнении их локальными сущностями в странах целевого языка. Кроме того, мы расширили охват целевых языков до 20 языков. Мы выпустим наш набор данных и набор надежных исходных данных для поощрения исследований по многоязычным системам ToD для реальных вариантов использования.Abstract
අන්තිම අවුරුදු කිහිපයක් පස්සේ, වෙනස් භාෂාවක් කතා කරන්න පුළුවන් මිනිස්සුන්ට සේවා කරන්න පුළුවන් දත්ත ක්රිය නමුත්, තියෙන්නේ බොහොම භාෂාවක් ToD දත්ත සැට් වලින් භාෂාවට සීමාවක් තියෙනවා නැත්නම් දත්ත ක්රියාවක් ගොඩක් විශාල විශ මේ සීමාව සටහන් කරන්න, අපි ලොකු දත්ත ක්රියාසිකරණ විධානයක් පරීක්ෂා කරනවා ඒක GlobalWoZ --- ලොකු විශාල භාෂාවක් ToD දත්ත සෙට් වලින් ඉංග්රීසි ToD දත්ත අපේ විධානය සංවාදය ටෙම්ප්ලේටල් වාර්ථා කරන්න සහ ස්ථානික භාෂාවයේ තියෙන ස්ථානික අයිතියෙන් ප ඒ වගේම, අපි ලක්ෂණ භාෂාවගේ ආවරණය 20 භාෂාවට වැඩ කරනවා. අපි අපේ දත්ත සූදානම් සහ ශක්තිමත් බේස්ලින් සූදානම් නිදහස් කරනවා ඇත්ත භාෂාවක් තොඩ් පද්ධතිය සඳහා අනAbstract
V zadnjih nekaj letih je prišlo do priprave podatkov za večjezične sisteme dialoga, usmerjene v naloge, ki lahko služijo ljudem, ki govorijo različne jezike. Vendar pa imajo obstoječi večjezični nabori podatkov o dokumentih bodisi omejeno pokritost jezikov zaradi visokih stroškov zbiranja podatkov bodisi ignorirajo dejstvo, da dialogni subjekti komaj obstajajo v državah, ki govorijo te jezike. Za odpravo teh omejitev predstavljamo novo metodo kuracije podatkov, ki ustvarja GlobalWoZ -- obsežen večjezični nabor podatkov ToD globaliziran iz angleškega nabora podatkov ToD za tri neraziskane primere uporabe večjezičnih sistemov ToD. Naša metoda temelji na prevajanju predlog dialoga in njihovem polnjenju z lokalnimi subjekti v državah ciljnega jezika. Poleg tega razširimo pokritost ciljnih jezikov na 20 jezikov. Objavili bomo naš nabor podatkov in nabor močnih osnovnih linij za spodbujanje raziskav večjezičnih sistemov ToD za resnične primere uporabe.Abstract
Sannadihii ugu danbeeyey dhawr sano waxaa la socday dhaqdhaqaaqi xafiiska macluumaadka ee ku qoran diyaarinta shaqada luuqadaha kala duduwan (ToD) oo u adeegi kara dadka ku hadla luuqado kala duduwan. Si kastaba ha ahaatee, macluumaadyada ToD ee luuqadaha kala duduwan waxay leeyihiin qarsoodi aad u xadan luqadaha sababtoo ah kharashka qarsoodiga macluumaadka, ama ka jeedso xaqiiqda, in dawlada bulshada looga baahan yahay wadamada ku hadlaya afkan. Si a an u tacliino xaduudahaas, waxaan u soo bandhignaa qaab warqad macluumaad ah oo ka soo saara GlobalWoZ --- taas oo ah danbiyo badan oo luuqad kala duduwan oo kala duduwan ToD ah oo laga soo bandhigay macluumaadka afka Ingiriiska ToD ee saddex xaaladood oo aan la shaqeyn isticmaalka ‘ nidaamka ToD’. Metalkeenu waxay ku saleysan tahay turjumidda qoraalka islamarkaasna ay buuxinayaan alaabta deegaanka ee wadamada luqada loogu talagalay. Besides, we extend the coverage of target languages to 20 languages. Waxaannu bixinaynaa taariikhdeena iyo heer caadi ah si aan u dhiirrigelino baaritaanka nidaamka ToD ee luuqadaha kala duduwan si ay u isticmaalaan xaaladaha runta ah.Abstract
Gjatë viteve të fundit, ka patur një masë drejt kurimit të të dhënave për sistemet e dialogut shumëgjuhës të orientuar në detyra (ToD) që mund të shërbejnë njerëzit që flasin gjuhë të ndryshme. Megjithatë, të dhënat ekzistuese shumëgjuhëse ToD ose kanë një mbulim të kufizuar gjuhësh për shkak të kostos së lartë të kurimit të të dhënave, ose injorojnë faktin se njësitë e dialogut mezi ekzistojnë në vendet që flasin këto gjuhë. Për të trajtuar këto kufizime, ne futim një metodë të re të kurimit të të dhënave që gjeneron GlobalWoZ -- një set të dhënash të shumëgjuhëshme ToD në skalë të madhe të globalizuar nga një set të dhënash të ToD angleze për tre raste përdorimi të papërshqyrtuar të sistemeve ToD shumëgjuhëse. Metoda jonë është bazuar në përkthimin e modeleve të dialogut dhe mbushjen e tyre me njësi lokale në vendet e gjuhës-objektiv. Përveç kësaj, ne zgjerojmë mbulimin e gjuhëve objektive në 20 gjuhë. Ne do të lëshojmë grupin tonë të dhënash dhe një grup bazash të forta për të inkurajuar kërkimin mbi sistemet shumëgjuhëse ToD për raste të përdorimit të vërtetë.Abstract
Tokom poslednjih nekoliko godina, postoji potez prema kuraciji podataka za sisteme dijaloga orijentiranog na višejezičkim zadacima (ToD) koji mogu služiti ljudima koji govore različite jezike. Međutim, postojeće multijezičke podatke o ToD-u ili imaju ograničeno pokrivanje jezika zbog visoke troškove kuracije podataka, ili ignorišu činjenicu da dijalogske entitate jedva postoje u zemljama koje govore ovim jezicima. Da bi se riješili ovim ograničenjima, predstavljamo novu metodu kuracije podataka koji stvara GlobalWoZ -- veliku multijezičku kompletu podataka za ToD globaliziranu iz kompleta podataka engleskog ToD za tri neobjašnjene korištenje slučajeva multijezičkih ToD sistema. Naša metoda je bazirana na prevodu šablona dijaloga i ispunjavanju ih lokalnim entitetima u zemljama ciljanog jezika. Osim toga, proširimo pokrivanje ciljnih jezika na 20 jezika. Oslobodićemo naš set podataka i skup jakih osnovnih linija za poticanje istraživanja o multijezičkim sistemima ToD-a za stvarne slučajeve upotrebe.Abstract
Under de senaste åren har det skett en utveckling mot datahantering för flerspråkiga uppgiftsorienterade dialogsystem (ToD) som kan betjäna människor som talar olika språk. De befintliga flerspråkiga datauppsättningarna har dock antingen begränsad språktäckning på grund av de höga kostnaderna för datahantering, eller ignorerar det faktum att dialogenheter knappt finns i länder som talar dessa språk. För att ta itu med dessa begränsningar introducerar vi en ny databehandlingsmetod som genererar GlobalWoZ --- en storskalig flerspråkig ToD-dataset globaliserad från en engelsk ToD-dataset för tre outforskade användningsfall av flerspråkiga ToD-system. Vår metod bygger på att översätta dialogmallar och fylla dem med lokala enheter i målspråksländerna. Dessutom utökar vi målspråkens täckning till 20 språk. Vi kommer att släppa vår dataset och en uppsättning starka baslinjer för att uppmuntra forskning om flerspråkiga ToD-system för verkliga användningsfall.Abstract
Katika miaka michache iliyopita, kumekuwa na hatua kuelekea vizuizi vya taarifa kwa ajili ya mazungumzo yanayoelekezwa kwa lugha mbalimbali (ToD) yanayoweza kuwatumia watu kuzungumza lugha tofauti. Hata hivyo, taarifa zinazopo kwa lugha mbalimbali za Kitambua ama zina habari mpya za lugha kwa sababu ya gharama kubwa za kufungiwa kwa taarifa, au kupuuza ukweli kuwa vitu vya mazungumzo vingi vigumu katika nchi zinazozungumza lugha hizi. Ili kukabiliana na vizuizi hivi, tunaonyesha njia ya ufungiaji wa taarifa za riwaya zinazotengeneza GlobalWoZ --- seti kubwa ya data ya ToD ya lugha mbalimbali zinazosambazwa kutoka kwenye takwimu za Kiingereza za za ToD kwa matumizi matatu yasiyotarajiwa ya mfumo wa lugha za Kiingereza. Utawala wetu umejikita na kutafsiri misitu ya mazungumzo na kuwajaza vifaa vya ndani katika nchi zenye lugha. Zaidi yake, tunaongeza habari za lugha zinazolenga hadi lugha 20. Tutakitoa taarifa zetu na seti kubwa za misingi ili kuhamasisha tafiti kuhusu mfumo wa lugha mbalimbali wa mfumo wa ToD kwa matumizi halisi.Abstract
கடந்த சில வருடங்களில், பல மொழி செயல் செலுத்தப்பட்ட உரையாடல் (ToD) அமைப்புகளுக்கு தகவல் திருப்புதலுக்கு ஒரு நகர்த்தல் ஏற்பட்டுள்ளது, அது ஆனால், இருக்கும் பல மொழி டோடி தகவல் அமைப்புகள் இந்த மொழிகளை பேசும் நாடுகளில் உரையாடல் பொருட்கள் குறைவாகவே இருக்கிறது என்பதை புறக்கணிக்கவும். இந்த எல்லைகளை tackle, நாம் ஒரு புதிய தரவு திருத்த முறைமையை குறிப்பிடுகிறோம், அது GlobalWoZ --- ஒரு பெரிய அளவு பல மொழி டோடி தகவல் அமைப்பு மூன்று எதிர்பாராத பயன்படுத்தப்படாத மூன்று Our method is based on translating dialogue templates and filling them with local entities in the target-language countries. மேலும், நாம் இலக்கு மொழிகளை 20 மொழிகளுக்கு விரிவாக்குகிறோம். நாம் எங்கள் தரவுத்தளத்தை வெளியேற்றுவோம் மற்றும் ஒரு வலிமையான அடிப்படை கோடுAbstract
Soňky bir näçe ýyldan soňra, birnäçe dil dilinde gürleşip biljek adamlary üçin maglumatlar merkezine bir göçdi bar. Ýöne bolan köp dilli ToD datumlary ýagdaýynda munyň üst bahalarynyň sebäbi ýa-da döwletlerde bu diller gepleýän döwletlerde diýen ýagdaýlar bardygyny bilmeýär. Bu çözgütleri çözmek üçin GlobalWoZ --- uluslary bir çoxly dilli ToD veri setinden globalizéieren iňlisçe ToD veri setinden üçin sözümlenmedik üçin täze bir maglumat merkezini tapdyryp tanyşdyrýarys. Biziň yöntemimiz dialogyň çäplerini terjime edip, olaryň ýerli bir zatlary hedef dillerinde doldurmak üçin dayanýar. Munuň ýagdaýda, maksadyň dillerini 20 dile uzatdyrýarys. Berüvlerimizi ve güçlü bir topar çizgileri gerçek işlemler için çoklu dilli ToD sistemlerini incelemek için yayınlayacağız.Abstract
گزشتہ چند سالوں میں، بہت سی زبان کی تابع کی سیستمات کے لئے ڈیٹ کورٹ کی طرف چل رہا ہے جو لوگوں کو مختلف زبان بولتے ہیں۔ لیکن موجود بہت سی زبان توڈ ڈاٹ سٹ ہیں یا ان زبانوں کی محدودیت کی حفاظت کرتی ہے، یا ان زبانوں میں جو ان زبانوں سے بولتے ہیں ان کی حقیقت کو غافل کر دیتے ہیں. یہ محدود کرنے کے لئے، ہم نے ایک نو ڈیٹا کریٹ کا طریقہ معلوم کرتا ہے جو GlobalWoZ کو پیدا کرتا ہے--- ایک بڑی نسبت بڑی زبان توD ڈیٹ سٹ جو انگلیسی ٹوڈ ڈیٹ سٹ سے گلوبل کیا گیا ہے تین بغیر منطقی استعمال کے مطابق بہت سی زبان توڈ ہمارا طریقہ ڈالیلوگ ٹیپلٹوں کو ترجمہ کرنا اور ان کو موجود زبان کشوروں میں محلی ایٹنیٹوں کے ساتھ بھرا رہا ہے. اور ہم نشانی زبانوں کی پورش 20 زبانوں تک پھیلاتے ہیں۔ ہم اپنے ڈاٹ سٹ اور ایک مجموعہ مضبوط بنسٹ لینوں کو روشن کریں گے کہ بہت سی زبان توڈ سیستموں پر واقعی استعمال کیے جاتے ہیں۔Abstract
Keyingi necha yil ichida, bir necha necha yil muloqon vazifa muloqat bilan muloqat muloqat oynasi (ToD) tizimlariga koʻchiriladi. Bu bir necha yil odamlarni boshqa tillar bilan gapiradigan tizimga ishlab chiqaradi. Ammo, mavjud muloqon ToD maʼlumotlar tarkibi maʼlumotlar tarkibi mavjud emas yoki maʼlumot qiymatining eng kichkina qismi sababchi boʻlgan tillar sohasini ko'rsatish mumkin, yoki bu tillarda gapiradigan muloqat maʼlumotlar faqat mavjud emas. Bu chegaralarni taklif qilish uchun biz GlobalWoZ - bir katta tildagi multili ToD maʼlumot tarkibini yaratish uchun eng tildagi ta'lim tugmalar tarkibi va uchta ishlatilmagan uchta foydalanuvchi tizimning uchta tili tizimi uchun. Bizning usuli dialog namunalarini tarjima qilish asosida, ularni lokal obʼektlar bilan toʻldirish. Ko'pchilik, biz qanday tilni 20 tillarda qarashmiz. Biz haqiqiqiy foydalanish uchun muloqat tili tizim tizimlariga qiziqarishni amalga oshirish uchun maxsus asboblar tugmalarimizni chiqaramiz.Abstract
Trong những năm gần đây, có một bước tiến tới việc chuyển giao dữ liệu cho các hệ thống liên lạc các nhiệm vụ đa dạng (ToD) có thể phục vụ người nói ngôn ngữ khác nhau. Tuy nhiên, các tập tin đa dạng Toi D hiện nay có một mức độ giới hạn về ngôn ngữ do mức giá cao của việc xử lý dữ liệu, hoặc lờ đi sự thật là các thực thể đối thoại hầu như không tồn tại ở những quốc gia nói những ngôn ngữ này. Để giải quyết những giới hạn này, chúng tôi giới thiệu một phương pháp xử lí dữ liệu mới tạo ra Global WoZ-- - một bộ dữ liệu phát triển ngôn ngữ đa dạng, toàn diện toàn diện từ một bộ dữ liệu ToD Anh quốc cho ba trường hợp không giải thích về sự sử dụng đa dạng. Phương pháp của chúng tôi dựa trên việc dịch mẫu cuộc đối thoại và điền đầy đủ các tổ chức địa phương ở các quốc gia ngôn ngữ đích. Thêm nữa, chúng ta sẽ mở rộng phạm vi ngôn ngữ mục tiêu đến chục ngôn ngữ. Chúng tôi sẽ công bố dữ liệu của chúng tôi và một bộ cơ sở cơ bản vững chắc để thúc đẩy nghiên cứu về hệ thống Tod đa dạng cho trường hợp dùng thực.Abstract
往数年中,多言事(ToD)系统之数据管理已变,当为异言者给事。 然则数据管理本高昂,今多言ToD数集或有限于言语之覆盖范围,或忽于用之国几无其实。 为此限者,引入一新数据管理法,当成GlobalWoZ---从英语ToD数集全球化大多语言ToD数集,施于三未发者多言ToD系统用例。 吾法基于译模板,并于语言国/填充本地实体。 此外,将的言语覆盖范围扩到20种语言。 将发吾数集和强基线,以劝用例言ToD统。- Anthology ID:
- 2022.acl-long.482
- Volume:
- Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)
- Month:
- May
- Year:
- 2022
- Address:
- Dublin, Ireland
- Venue:
- ACL
- SIG:
- Publisher:
- Association for Computational Linguistics
- Note:
- Pages:
- 6997–7013
- Language:
- URL:
- https://aclanthology.org/2022.acl-long.482
- DOI:
- Bibkey:
- Cite (ACL):
- Daniel Hershcovich, Stella Frank, Heather Lent, Miryam de Lhoneux, Mostafa Abdou, Stephanie Brandl, Emanuele Bugliarello, Laura Cabello Piqueras, Ilias Chalkidis, Ruixiang Cui, Constanza Fierro, Katerina Margatina, Phillip Rust, and Anders Søgaard. 2022. Challenges and Strategies in Cross-Cultural NLP. In Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 6997–7013, Dublin, Ireland. Association for Computational Linguistics.
- Cite (Informal):
- Challenges and Strategies in Cross-Cultural NLP (Hershcovich et al., ACL 2022)
- Copy Citation:
- PDF:
- https://aclanthology.org/2022.acl-long.482.pdf
- Data
- MaRVL
- Terminologies:
Export citation
@inproceedings{hershcovich-etal-2022-challenges, title = "Challenges and Strategies in Cross-Cultural {NLP}", author = "Hershcovich, Daniel and Frank, Stella and Lent, Heather and de Lhoneux, Miryam and Abdou, Mostafa and Brandl, Stephanie and Bugliarello, Emanuele and Cabello Piqueras, Laura and Chalkidis, Ilias and Cui, Ruixiang and Fierro, Constanza and Margatina, Katerina and Rust, Phillip and S{\o}gaard, Anders", booktitle = "Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)", month = may, year = "2022", address = "Dublin, Ireland", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2022.acl-long.482", pages = "6997--7013", }
<?xml version="1.0" encoding="UTF-8"?> <modsCollection xmlns="http://www.loc.gov/mods/v3"> <mods ID="hershcovich-etal-2022-challenges"> <titleInfo> <title>Challenges and Strategies in Cross-Cultural NLP</title> </titleInfo> <name type="personal"> <namePart type="given">Daniel</namePart> <namePart type="family">Hershcovich</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Stella</namePart> <namePart type="family">Frank</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Heather</namePart> <namePart type="family">Lent</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Miryam</namePart> <namePart type="family">de Lhoneux</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Mostafa</namePart> <namePart type="family">Abdou</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Stephanie</namePart> <namePart type="family">Brandl</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Emanuele</namePart> <namePart type="family">Bugliarello</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Laura</namePart> <namePart type="family">Cabello Piqueras</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Ilias</namePart> <namePart type="family">Chalkidis</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Ruixiang</namePart> <namePart type="family">Cui</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Constanza</namePart> <namePart type="family">Fierro</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Katerina</namePart> <namePart type="family">Margatina</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Phillip</namePart> <namePart type="family">Rust</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Anders</namePart> <namePart type="family">Søgaard</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <originInfo> <dateIssued>2022-05</dateIssued> </originInfo> <typeOfResource>text</typeOfResource> <relatedItem type="host"> <titleInfo> <title>Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)</title> </titleInfo> <originInfo> <publisher>Association for Computational Linguistics</publisher> <place> <placeTerm type="text">Dublin, Ireland</placeTerm> </place> </originInfo> <genre authority="marcgt">conference publication</genre> </relatedItem> <identifier type="citekey">hershcovich-etal-2022-challenges</identifier> <location> <url>https://aclanthology.org/2022.acl-long.482</url> </location> <part> <date>2022-05</date> <extent unit="page"> <start>6997</start> <end>7013</end> </extent> </part> </mods> </modsCollection>
%0 Conference Proceedings %T Challenges and Strategies in Cross-Cultural NLP %A Hershcovich, Daniel %A Frank, Stella %A Lent, Heather %A de Lhoneux, Miryam %A Abdou, Mostafa %A Brandl, Stephanie %A Bugliarello, Emanuele %A Cabello Piqueras, Laura %A Chalkidis, Ilias %A Cui, Ruixiang %A Fierro, Constanza %A Margatina, Katerina %A Rust, Phillip %A Søgaard, Anders %S Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) %D 2022 %8 May %I Association for Computational Linguistics %C Dublin, Ireland %F hershcovich-etal-2022-challenges %U https://aclanthology.org/2022.acl-long.482 %P 6997-7013
Markdown (Informal)
[Challenges and Strategies in Cross-Cultural NLP](https://aclanthology.org/2022.acl-long.482) (Hershcovich et al., ACL 2022)
- Challenges and Strategies in Cross-Cultural NLP (Hershcovich et al., ACL 2022)
ACL
- Daniel Hershcovich, Stella Frank, Heather Lent, Miryam de Lhoneux, Mostafa Abdou, Stephanie Brandl, Emanuele Bugliarello, Laura Cabello Piqueras, Ilias Chalkidis, Ruixiang Cui, Constanza Fierro, Katerina Margatina, Phillip Rust, and Anders Søgaard. 2022. Challenges and Strategies in Cross-Cultural NLP. In Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 6997–7013, Dublin, Ireland. Association for Computational Linguistics.