The Margarita Dialogue Corpus : A Data Set for Time-Offset Interactions and Unstructured Dialogue Systems Die Margarita Dialoog Korpus: ' n Data stel vir Tyd- Offset Interaksies en Onstruktureerde Dialoog Systeme The Margarita Dialog Corpus: A Data Set for Time-Offset Interactions and Unstructured Dialog Systems مجموعة حوار مارجريتا: مجموعة بيانات لتفاعلات إزاحة الوقت وأنظمة الحوار غير المنظمة Margarita Dialog Corpus: Vaxt-Offset Interactions və Qurulmadığı Dialoog Sistemləri üçün məlumat qurğuları Корпусът на диалога Маргарита: набор от данни за взаимодействията между времето и неструктурираните диалогови системи মার্গেরিতা ডায়ালগ কোর্পাস: সময়-অফ-সেট ইন্টারনেটের জন্য একটি ডাটা নির্ধারণ এবং অকার্যকর ডায়ালগ সিস্টেম མགོ་རིམ་གླེང་སྒྲོམ་མཐོང་མཚམས་འདུག:དུས་ཚོད་སྒྲིག་འཛུགས་ཀྱི་གནས་སྟངས་དང་སྒྲིག་མེད་པའི་ཌའི་ལོག་གི་མ་ལག Korpus Margarita dijaloga: Podatak za interakcije vremenskih prestanka i nestrukturalne dijalogske sisteme El Corpus de Diàleg Margarita: Un conjunt de dades per interaccions temporals i sistemes de diàleg no estructurats Margarita Dialogue Corpus: Datová sada pro časově-offsetové interakce a nestrukturované dialogové systémy Margarita Dialogue Corpus: Et datasæt for tidsforskydninger og ustrukturerede dialogsystemer Das Margarita Dialogkorpus: Ein Datensatz für Zeitverschiebungen und unstrukturierte Dialogsysteme Το Σώμα Διαλόγων Μαργαρίτα: Ένα σύνολο δεδομένων για αλληλεπιδράσεις χρονικής αντιστάθμισης και συστήματα ασταθούς διαλόγου El Corpus Dialogue de Margarita: un conjunto de datos para interacciones con compensación de tiempo y sistemas de diálogo no estructurados Margarita dialoogikorpus: ajavahetuse ja struktureerimata dialoogisüsteemide andmekogum جسد محاورۀ محاورۀ Margarita: یک مجموعه داده برای تفاوتهای زمان- Offset و سیستمهای محاورۀ ساخته نشده The Margarita Dialogue Corpus: Data Set for Time-Offset Interactions and Unstructured Dialogue Systems The Margarita Dialogue Corpus : un ensemble de données pour les interactions décalées dans le temps et les systèmes de dialogue non structurés Corpas Idirphlé Margarita: Tacar Sonraí le haghaidh Idirghníomhaíochtaí Fritháireamh Ama agus Córais Idirphlé Neamhstruchtúrtha KCharselect unicode block name קורפוס הדיולוג של מרגריטה: קבוצת נתונים למערכות שיתופים של זמן-Offset मार्गरीटा संवाद कॉर्पस: समय-ऑफसेट इंटरैक्शन और असंरचित संवाद प्रणालियों के लिए एक डेटा सेट Korpus Margarita dijaloga: Podatak za interakcije vremenskih premještaja i nestrukturirane dijalogske sustave A Margarita Dialogue Corpus: az időeltolódási interakciók és a strukturálatlan párbeszédrendszerek adatkészlete Մարգարիտայի հաղորդակցման կորպուսը. Ժամանակի-օֆսետի ինտերակցիաների և անկառուցվածքային հաղորդակցման համակարգերի տվյալների համակարգ The Margarita Dialogue Corpus: A Data Set for Time-Offset Interactions and Unstructured Dialogue Systems Il corpo di dialogo Margarita: un set di dati per interazioni time-offset e sistemi di dialogo non strutturati The Margarita Dialogue Corpus: A Data Set for Time - Offset Interactions and Unstructured Dialogue Systems ProgressBar Dialog მარდარიტა დიალოგის კორპოსი: მონაცემები სისტემებისთვის მონაცემების კონფიგურაცია და განსრულებული დიალოგის სისტემებისთვის Маргарита диалогының корпус: Уақыт- жылжыту интерфейстері мен құрылмаған диалог жүйелерінің деректер баптауы 마가리타 대화 자료 라이브러리: 시간 편이 상호작용과 비구조화 대화 시스템의 데이터 집합 The Margarita Dialogue Corpus: A Data Set for Time-Offset Interactions and Unstructured Dialogue Systems Корпусот на дијалогот за маргарита: Податоци за интеракции со временско отфрлање и неструктурирани дијалошки системи മാര്ഗേരിറ്റാ ഡയലോഗ് കോര്പ്സ്: സമയത്തിനുള്ള ഇടപാടുകള്ക്കും നിര്മ്മിതമാക്കാത്ത ഡയലോഗ് സിസ്റ്റം Margarita Dialog Corpus: Time-Offset Interactions and Unstructured Dialog Systems Data Set Korpus Dialog Margarita: Set Data untuk Interaksi Ofset Masa dan Sistem Dialog Tidak Terstruktur Il-Korp tad-Djalogu Margarita: Sett ta’ Dejta għal Interazzjonijiet ta’ Offset taż-Żmien u Sistemi ta’ Djalogu Mhux Strutturati Het Margarita Dialogkorpus: Een dataset voor Time-Offset Interacties en Unstructureerde Dialogsystemen Margaritdialog- korpus: Ein datasett for tidskoffsett- interaksjonar og ikkje- strukturerte dialogsystemar Korpus Dialogu Margarita: Zestaw danych dla interakcji czasowo-offsetowych i nieustrukturyzowanych systemów dialogu O Corpus de Diálogo Margarita: um conjunto de dados para interações de compensação de tempo e sistemas de diálogo não estruturados Corpul dialogului Margarita: un set de date pentru interacțiunile temporare și sistemele de dialog nestructurate The Margarita Dialogue Corpus: A Data Set for Time-Offset Interactions and Unstructured Dialogue Systems මාර්ගරිටා සංවාද කොර්පුස්: වෙලාව- විස්තාරය සහ සංවාද පද්ධතිය සඳහා දත්ත සැකසුම් Korpus dialoga Margarita: nabor podatkov za interakcije s časovnim premikom in nestrukturirane dialogne sisteme Dagaalka Margarita: A Data Set for Time-Offset Interactions and Unstructured Dialog Systems Korpus i dialogut të Margaritës: Një grup i të dhënave për ndërveprimet e afatit të kohës dhe sistemet e dialogut të pabastruktuar Корпус диалога Маргарита: Набор данных за интеракцију времена пресети и неструктурирани диалог системи Margarita Dialogue Corpus: En datauppsättning för tidsförskjutna interaktioner och ostrukturerade dialogsystem Kampuni ya Dialogu ya Margarita: Taarifa kwa ajili ya matukio ya muda na mifumo ya Dialogu isiyojengwa Name Gabdalyk диалог köpüsi: Zaman offset Interaksileri we strukturmadyk диалог sistemleri üçin bir Maglumat Seti مارگاریٹا ڈالیلوگ کورپوس: زمان-اوفسٹ انٹراکس اور غیر ساختہ ڈالیلوگ سیسٹم کے لئے ایک ڈاٹ سیٹ Name Công ty đối thoại Margarita: Một tập tin về tương tác vượt thời gian và hệ thống đối thoại đột biến 玛格丽塔对语料库:时偏移交非结构化对统数集
Abstract
Time-Offset Interaction Applications (TOIAs) are systems that simulate face-to-face conversations between humans and digital human avatars recorded in the past. Developing a well-functioning TOIA involves several research areas : artificial intelligence, human-computer interaction, natural language processing, question answering, and dialogue systems. The first challenges are to define a sensible methodology for data collection and to create useful data sets for training the system to retrieve the best answer to a user’s question. In this paper, we present three main contributions : a methodology for creating the knowledge base for a TOIA, a dialogue corpus, and baselines for single-turn answer retrieval. We develop the methodology using a two-step strategy. First, we let the avatar maker list pairs by intuition, guessing what possible questions a user may ask to the avatar. Second, we record actual dialogues between random individuals and the avatar-maker. We make the Margarita Dialogue Corpus available to the research community. This corpus comprises the knowledge base in text format, the video clips for each answer, and the annotated dialogues.Abstract
Tyd-Offset Interaksie-toepassings (TOIAs) is stelsels wat gesig-na-gesig gesprekke simuleer tussen mense en digitale menslike avatars wat in die verlede opgeneem is. Die ontwikkeling van 'n goed funksioneerde TOIA involveer verskeie ondersoek gebiede: kunstenaar inteligensie, menslike-rekenaar interaksie, natuurlike taal verwerking, vraag antwoord en dialoog stelsels. Die eerste uitdagings is om 'n sensible metodologie vir data versameling te definieer en om gebruiklike data stelle te skep vir onderwerp van die stelsel om die beste antwoord op 'n gebruiker se vraag te kry. In hierdie papier stel ons drie hoofbydraaie voorsien: 'n metodologie vir die skep van die kennis basis vir 'n TOIA, 'n dialoog korpus en basisline vir enkele draai antwoord ontvang. Ons ontwikkel die metodologie met 'n twee-stap strategie. Eerste laat ons die avatar-maker lys paar deur intuisie, wat moontlik vrae 'n gebruiker kan vra na die avatar. Tweede, ons rekord werklike dialoog tussen willekeurige individue en die avatar-maker. Ons maak die Margarita Dialoog Korpus beskikbaar vir die ondersoek gemeenskap. Hierdie korpus bevat die kennis basie in teks formaat, die video klippe vir elke antwoord en die aanmerkte dialoog.Abstract
Time-Offset Interaction Applications (TOIA) are systems that are simulated face-to-face conversation between humans and digital human avatars in the past. የTOIA ደጋሚ ሥራ መግለጫ ብዙዎችን ምርመራ ክፍሎች ያስተካክላል: የፍጥረት ማስታወሻ፣ የሰው ኮምፒውተር ግንኙነት፣ የፍጥረቱ ቋንቋ ማቀናጃ፣ ጥያቄ መልስ እና የመስመር ስርዓት ስርዓቶች፡፡ የመጀመሪያው ጥያቄዎች ለዳታ ሰብስብ እና ለጥያቄ ሲስተማርና ለተጠቃሚ ጥያቄ መልስ ለማግኘት ስርዓቱን ለመፍጠር የሚጠቀም የዳታ ዘይቶች ማዘጋጀት ነው፡፡ በዚህ ፕሮግራም ሦስት የዋና ጥያቄዎችን እናቀርባለን፤ ለTOIA እውቀትን መሠረት ማድረግ፣ የጥያቄ አካባቢ እና የአንዲት መለያየት መቀናቀል መሠረት ማድረጊያ ነው፡፡ የሁለት ደረጃዎች strategieን እናሳድጋለን፡፡ አስቀድመን፣ የተጠቃሚው ጥያቄ የሚጠይቅ ምንድን እንደሆነ እናስታውቃለን፡፡ ሁለተኛ፣ በአካባቢው እና በአካታር-ፈጣሪ መካከል የውይይት ጥያቄዎችን እናስቆጥረዋለን፡፡ ማርጋita ዳይሎጂ ቆርፓስ ለትምህርት ማኅበረሰብ ማግኘት እናደርጋለን፡፡ This corpus comprises the knowledge base in text format, the video clips for each answer, and the annotated dialogues.Abstract
تطبيقات تفاعل إزاحة الوقت (TOIAs) هي أنظمة تحاكي المحادثات وجهًا لوجه بين البشر والصور الرمزية البشرية الرقمية المسجلة في الماضي. يتضمن تطوير TOIA تعمل بشكل جيد العديد من مجالات البحث: الذكاء الاصطناعي ، والتفاعل بين الإنسان والحاسوب ، ومعالجة اللغة الطبيعية ، والإجابة على الأسئلة ، وأنظمة الحوار. تتمثل التحديات الأولى في تحديد منهجية معقولة لجمع البيانات وإنشاء مجموعات بيانات مفيدة لتدريب النظام على استرداد أفضل إجابة لسؤال المستخدم. في هذه الورقة ، نقدم ثلاث مساهمات رئيسية: منهجية لإنشاء قاعدة معرفية لـ TOIA ، ومجموعة حوار ، وخطوط أساسية لاسترجاع الإجابات من منعطف واحد. نقوم بتطوير المنهجية باستخدام استراتيجية من خطوتين. أولاً ، تركنا أزواج قائمة صانع الصور الرمزية عن طريق الحدس ، وتخمين الأسئلة المحتملة التي قد يطرحها المستخدم على الصورة الرمزية. ثانيًا ، نسجل الحوارات الفعلية بين الأفراد العشوائيين وصانع الصور الرمزية. نجعل مجموعة Margarita Dialogue Corpus متاحة لمجتمع البحث. تشتمل هذه المجموعة على قاعدة المعرفة بتنسيق النص ومقاطع الفيديو لكل إجابة والحوارات المشروحة.Abstract
Zaman-Offset Interaction Programları (TOIAs) əvvəlki neçə-neçə insan və dijital insan avatarları arasındakı görüşmələri simülatlı sistemlərdir. İyi işlənən TOIA təhsil edilməsi bir çox araştırma bölümlərindəndir: sanatlı intellekt, insan-kompjuter etkileşimi, təbiətli dil işləməsi, sual cavab verməsi və dijalog sistemlərindəndir. Əvvəlki çətinliklər məlumatlar koleksiyonunun ən yaxşı cavabını almaq üçün sistemi təhsil etmək üçün mənfəətli məlumatları təyin etməkdir. Bu kağızda üç ana kömək göstəririk: TOIA-nın elm üssünü yaratmaq üçün bir metodoloji, diyal korpus və tək dönüş cavabı almaq üçün baz çətinləri. Biz metodolojiyi iki adım strateji ilə təhsil edirik. Əvvəlcə, avatar yaratıcıların listesini intuitiya ilə cütlər təyin edirik, istifadəçinin avatar ı soruşması mümkün olan suallarını tahmin edirik. İkincisi, biz vəziyyətli kişilər və avatar ürəkçiləri arasında gerçek dialoglar yazırıq. Biz Margarita Dialog Corpusu araşdırma toplumuna faydalandırırıq. Bu korpus mətn format ında bilgi bazı, hər cavab üçün video clips və mətn dialoglarında yazılır.Abstract
Приложенията за взаимодействие (ТОИ) са системи, които симулират разговори лице в лице между хора и цифрови човешки аватари записани в миналото. Разработването на добре функционираща ОИА включва няколко изследователски области: изкуствен интелект, взаимодействие човек-компютър, обработка на естествен език, отговори на въпроси и диалогови системи. Първите предизвикателства са дефинирането на разумна методология за събиране на данни и създаването на полезни набори от данни за обучение на системата за извличане на най-добрия отговор на потребителския въпрос. В настоящата статия представяме три основни приноса: методология за създаване на база от знания за ОИА, диалогов корпус и базови линии за извличане на отговори с един завой. Разработваме методологията, използвайки двустепенна стратегия. Първо, позволяваме на създателя на аватари списък с двойки по интуиция, предполагайки какви възможни въпроси може да зададе потребителят на аватара. Второ, записваме реални диалози между случайни индивиди и създателя на аватари. Ние правим Корпуса за диалог Маргарита достъпен за изследователската общност. Този корпус включва базата от знания в текстов формат, видеоклиповете за всеки отговор и анотираните диалози.Abstract
টাইম- অফেসেট ইন্টারনেট অ্যাপ্লিকেশন (টোআইএ) হচ্ছে ব্যবস্থা যা অতীতে রেকর্ড করা হয়েছে মানুষ এবং ডিজিটাল মানুষের অ্যাভাটারের মধ্ একটি ভালো কাজ করে টোয়ার ব্যবস্থা তৈরি করার বেশ কয়েকটি গবেষণা এলাকায় যুক্ত রয়েছে: শৈল্পিক গোয়েন্দা, মানুষ-কম্পিউটার ইন্টারনেট, প্রাকৃত প্রথম চ্যালেঞ্জ হলো ডাটা সংগ্রহের জন্য একটি সুবিধাজনক পদ্ধতি নির্ধারণ করা এবং ব্যবহারকারীর প্রশ্নের জন্য সিস্টেম প্রশিক্ষণের জন্যে ক এই কাগজটিতে আমরা তিনটি প্রধান অবদান উপস্থাপন করছি: টোআইএ এর জ্ঞানের বেস তৈরি করার একটি পদ্ধতি, একটি ডায়ালগ কোর্পাস এবং একটি প্রত্যেক উত্তর পুনরুদ্ধার We develop the methodology using a two-step strategy. প্রথমত, আমরা আভাতার নির্মাতা তালিকার জোড়াকে বুঝতে দিয়েছি, অনুমান করছি যে একজন ব্যবহারকারী কি সম্ভব প্রশ্ন করতে পারে সে দ্বিতীয়, আমরা আসল কথোপকথন রেকর্ড করি ব্যক্তি এবং ভ্যাটার-নির্মাতারের মধ্যে। আমরা মার্গেরিতা ডায়ালগ কোর্পাস গবেষণা সম্প্রদায়ের কাছে পাওয়া যাচ্ছি। এই কোর্পাস টেক্সট ফর্ম্যাটে জ্ঞানের বেস, প্রত্যেক উত্তরের ভিডিও ক্লিপ এবং বিরক্তিকর ডায়ালগের মধ্যে রয়েছে।Abstract
དུས་འདས་ནས་སྤྱད་ནས་དུས་འདས ལྡོམ་རྩོམ་པ་ཞིག་ལས་སྦྱོར་བའི་TOIA་འདི་ནང་ལས་འཚོལ་ཞིབ་ཀྱི་གནད་དོན་མང་པོ་ཞིག་ཡོད། གདོང་ལེན་དང་པོ་དག་དེ་སྤྱོད་མཁན་གྱི་འདྲི་ཚིག འུ་ཅག་གི་ཤོག་བུ་འདིའི་ནང་དུ་ང་ཚོས་རྩ་བའི་གོ་སྐབས་གསུམ་འཆར་བྱེད་ཀྱི་ཡོད། ང་ཚོས་རྒྱལ་ཁབ་ཀྱི་ལམ་ལུགས་འདི་རྒྱལ་ཁབ་གཉིས་གྱི་ཐབས་ལམ་ཞིག་སྤྱད་ནས་བཟོ་བྱེད་ཀྱི་ཡོད། དང་པོ་ནས་ང་ཚོས་འདྲ་བརྗོད་པ་ཞིག་གིས་གཟུགས་རིས་གསར་འཛུགས་པའི་ཐོ་འགོད་ལ་མཐུན་པ་དང་མི་འདྲ་བྱེད་པ་ཞིག་ཏུ་སྤྱོད་མཁ གཉིས་པ། ང་ཚོས་དུས་ཡོད་པའི་མི་དང་གཟུགས་རིས་བྱེད་མཁན་གྱི་ཐད་ཀར་བློ་གཏོང་བ་དེ་རེད། ང་ཚོས་འཚོལ་བཤེར་ཚོགས་ཀྱི་རྣམ་གྲངས་སྒྲོམ་གྱི་རྩོམ་པ་ཁང་ལ་འཐོབ་ཐུབ་པ། སྒེར་གྱི་རྩོམ་པ་འདིས་ཡི་གེའི་དབྱིབས་དབྱིབས་ཡོད་པའི་གནས་ཚུལ་གཞི་རྩ་སྒྲིག་ནང་དུ་ཡོད་པ་དང་ཐོག་འཕྲིན་གྲངས་སྒྲོAbstract
Prijave o interakciji vrijeme-Offset (TOIAs) su sistemi koji simuliraju razgovore sa licem na lice između ljudskih i digitalnih ljudskih avatara zabilježenih u prošlosti. Razvoj dobro funkcioniranog TOIA uključuje nekoliko istraživačkih područja: umjetnost inteligencije, interakcija ljudskih kompjutera, prirodno obrađivanje jezika, odgovor na pitanja i dijalog. Prvi izazov je definisati razumnu metodologiju za kolekciju podataka i stvaranje korisnih seta podataka za obuku sustava kako bi dobio najbolji odgovor na pitanje korisnika. U ovom papiru predstavljamo tri glavne doprinosa: metodologija za stvaranje baze znanja za TOIA, dijalogski korpus i osnovne linije za povratak odgovora na jednookret. Razvijamo metodologiju koristeći strategiju dva koraka. Prvo, dozvolimo da popis avatarskih proizvođa ča postavlja par intuicije, pretpostavljajući moguća pitanja koje korisnik može postaviti avataru. Drugo, snimamo prave dijaloge između nasumičnih pojedinaca i avatarskog proizvođača. Postavljamo korpus dialoga Margarite na raspolaganju istraživačkoj zajednici. Ovaj korpus sastoji bazu znanja u tekstu, video snimke za svaki odgovor i annotirane dijaloge.Abstract
Les aplicacions d'interacció Time-Offset (TOIAs) són sistemes que simulan converses cara a cara entre els humans i els avatars humans digitals gravads en el passat. El desenvolupament d'una TOIA que funcioni bé implica diverses àrees de recerca: intel·ligència artificial, interacció entre humans i ordinadors, processament natural de llenguatges, resposta a preguntes i sistemes de diàleg. The first challenges are to define a sensible methodology for data collection and to create useful data sets for training the system to retrieve the best answer to a user's question. En aquest paper, presentem tres aportacions principals: una metodologia per crear la base de coneixements d'una TOIA, un corpus de diàleg, i línies de base per a obtenir una resposta d'un cop. Desenvolvem la metodologia utilitzant una estratègia de dos passos. Primer, deixem que el creador d'avatars es parell per intuïció, adivinant quines preguntes pot fer un usuari a l'avatar. Segon, enregistrem els diàlegs reals entre individus aleatòries i el creador d'avatars. Fem disponible el Corpus de Diàleg Margarita a la comunitat de recerca. Aquest corpus té la base de coneixements en format de text, els vídeos de cada resposta i els diàlegs anotats.Abstract
Time-Offset Interaction Applications (TOIA) jsou systémy, které simulují osobní konverzace mezi lidmi a digitálními lidskými avatary zaznamenanými v minulosti. Vývoj dobře fungujícího TOIA zahrnuje několik oblastí výzkumu: umělou inteligenci, interakci člověka-počítače, zpracování přirozeného jazyka, odpovědi na otázky a dialogové systémy. První výzvou je definovat rozumnou metodiku sběru dat a vytvořit užitečné datové sady pro školení systému, aby získal co nejlepší odpověď na otázku uživatele. V tomto článku představujeme tři hlavní příspěvky: metodiku vytvoření znalostní báze pro TOIA, dialogový korpus a základní linie pro vyhledávání odpovědí jednotlivým otočením. Metodiku vyvíjíme pomocí dvoustupňové strategie. Nejprve necháme tvůrce avatarů seznam párů intuicí a hádáme, jaké možné otázky může uživatel položit avatarovi. Za druhé zaznamenáváme skutečné dialogy mezi náhodnými jedinci a avatarovým tvůrcem. Poskytujeme sbor dialogu Margarita k dispozici výzkumné komunitě. Tento korpus obsahuje znalostní bázi v textovém formátu, videoklipy pro každou odpověď a anotované dialogy.Abstract
Time-Offset Interaction Applications (TOIA'er) er systemer, der simulerer ansigt til ansigt samtaler mellem mennesker og digitale menneskelige avatarer registreret tidligere. Udviklingen af en velfungerende TOIA involverer flere forskningsområder: kunstig intelligens, menneske-computer interaktion, naturlig sprogbehandling, spørgsmål besvarelse og dialogsystemer. De første udfordringer er at definere en fornuftig metode til dataindsamling og at skabe nyttige datasæt til at træne systemet til at hente det bedste svar på en brugers spørgsmål. I denne artikel præsenterer vi tre hovedbidrag: en metode til at skabe vidensbase for en TOIA, et dialogkorpus og baselines for single-turn svar hentning. Vi udvikler metoden ved hjælp af en todrinsstrategi. Først lader vi avatar maker listen parre ved intuition, gætte hvilke mulige spørgsmål en bruger kan stille til avataren. For det andet optager vi faktiske dialoger mellem tilfældige individer og avatarskaberen. Vi stiller Margarita Dialogue Corpus til rådighed for forskningssamfundet. Dette korpus omfatter vidensbasen i tekstformat, videoklipene til hvert svar og de kommenterede dialoger.Abstract
Time-Offset Interaction Applications (TOIAs) sind Systeme, die persönliche Gespräche zwischen Menschen und digitalen menschlichen Avataren simulieren, die in der Vergangenheit aufgezeichnet wurden. Die Entwicklung eines gut funktionierenden TOIA umfasst mehrere Forschungsbereiche: künstliche Intelligenz, Mensch-Computer-Interaktion, natürliche Sprachverarbeitung, Fragebeantworterung und Dialogsysteme. Die ersten Herausforderungen bestehen darin, eine sinnvolle Methodik für die Datenerhebung zu definieren und nützliche Datensätze für die Schulung des Systems zu erstellen, um die beste Antwort auf die Frage eines Benutzers zu erhalten. In diesem Beitrag stellen wir drei Hauptbeiträge vor: eine Methodik zur Erstellung der Wissensbasis für ein TOIA, ein Dialogkorpus und Basislinien für Single-Turn Antworten Retrieval. Wir entwickeln die Methodik in einer zweistufigen Strategie. Zuerst lassen wir den Avatar Maker Paare intuitiv auflisten und raten, welche möglichen Fragen ein Benutzer an den Avatar stellen kann. Zweitens nehmen wir tatsächliche Dialoge zwischen zufälligen Individuen und dem Avatarmacher auf. Wir stellen das Margarita Dialogue Corpus der Forschungsgemeinschaft zur Verfügung. Dieses Korpus umfasst die Wissensdatenbank im Textformat, die Videoclips zu jeder Antwort und die kommentierten Dialoge.Abstract
Οι εφαρμογές αλληλεπίδρασης χρόνου-μετατόπισης είναι συστήματα που προσομοιώνουν προσωπικές συνομιλίες μεταξύ ανθρώπων και ψηφιακών ανθρώπινων avatars που καταγράφονται στο παρελθόν. Η ανάπτυξη μιας καλά λειτουργικής ΤΟΙΑ περιλαμβάνει διάφορους τομείς έρευνας: τεχνητή νοημοσύνη, αλληλεπίδραση ανθρώπου-υπολογιστή, επεξεργασία φυσικής γλώσσας, απάντηση ερωτήσεων και συστήματα διαλόγου. Οι πρώτες προκλήσεις είναι ο καθορισμός μιας λογικής μεθοδολογίας για τη συλλογή δεδομένων και η δημιουργία χρήσιμων συνόλων δεδομένων για την εκπαίδευση του συστήματος ώστε να ανακτήσει την καλύτερη απάντηση στην ερώτηση ενός χρήστη. Στην παρούσα εργασία, παρουσιάζουμε τρεις βασικές συνεισφορές: μια μεθοδολογία για τη δημιουργία της βάσης γνώσης για μια ΤΟΙΑ, ένα σώμα διαλόγου, και γραμμές βάσης για την ανάκτηση απαντήσεων με μία στροφή. Αναπτύσσουμε τη μεθοδολογία χρησιμοποιώντας μια στρατηγική δύο βημάτων. Πρώτον, αφήνουμε τον δημιουργό λίστας με διαίσθηση ζεύγη, μαντεύοντας ποιες πιθανές ερωτήσεις μπορεί να κάνει ένας χρήστης στο άβαταρ. Δεύτερον, καταγράφουμε πραγματικούς διαλόγους μεταξύ τυχαίων ατόμων και του δημιουργού avatar. Κάνουμε το Σώμα Διάλογου Μαργαρίτας διαθέσιμο στην ερευνητική κοινότητα. Το σώμα αυτό περιλαμβάνει τη βάση γνώσεων σε μορφή κειμένου, τα βίντεο κλιπ για κάθε απάντηση και τους σχολιασμένους διαλόγους.Abstract
Las aplicaciones de interacción con compensación de tiempo (TOIA) son sistemas que simulan conversaciones cara a cara entre humanos y avatares humanos digitales grabados en el pasado. El desarrollo de una TOIA que funcione correctamente implica varias áreas de investigación: inteligencia artificial, interacción humano-computadora, procesamiento del lenguaje natural, respuesta a preguntas y sistemas de diálogo. Los primeros desafíos son definir una metodología sensata para la recopilación de datos y crear conjuntos de datos útiles para capacitar al sistema a fin de obtener la mejor respuesta a la pregunta de un usuario. En este artículo, presentamos tres contribuciones principales: una metodología para crear la base de conocimientos para un TOIA, un corpus de diálogo y líneas de base para la recuperación de respuestas de un solo turno. Desarrollamos la metodología mediante una estrategia de dos pasos. Primero, dejamos que el creador de avatares enumere los pares por intuición, adivinando las posibles preguntas que un usuario puede hacerle al avatar. En segundo lugar, registramos diálogos reales entre individuos aleatorios y el creador de avatares. Ponemos el Corpus Diálogo Margarita a disposición de la comunidad investigadora. Este corpus comprende la base de conocimientos en formato de texto, los videoclips de cada respuesta y los diálogos anotados.Abstract
Time-Offset Interaction Applications (TOIA) on süsteemid, mis simuleerivad näost näkku vestlusi inimeste ja digitaalsete inimavatarite vahel, mis on salvestatud minevikus. Hästi toimiva TOIA arendamine hõlmab mitmeid uurimisvaldkondi: tehisintellekt, inimese-arvuti suhtlus, looduskeele töötlemine, küsimustele vastamine ja dialoogisüsteemid. Esimesed väljakutsed on määratleda mõistlik andmete kogumise metoodika ja luua kasulikke andmekogumeid süsteemi koolitamiseks, et leida kasutaja küsimusele parim vastus. Käesolevas töös esitame kolme peamist panust: metoodika teadmistebaasi loomiseks TOIA jaoks, dialoogikorpus ja lähtejooned ühekordse vastuse saamiseks. Me arendame metoodikat kaheastmelise strateegia abil. Kõigepealt laseme avatari loojal luua paari intuitsiooni järgi, arvates ära, milliseid võimalikke küsimusi kasutaja võib avatarile esitada. Teiseks salvestame tegelikke dialooge juhuslike isikute ja avatari looja vahel. Me teeme Margarita Dialogue Corpuse teadusringkondadele kättesaadavaks. Korpus koosneb tekstivormingus teadmistebaasist, iga vastuse videoklippidest ja märgitud dialoogidest.Abstract
برنامههای تفاوت زمانافتس (TOIAs) سیستمهایی است که در گذشته ضبط شدهاند، مکالمههای صورت و صورت را شبیهسازی میکنند بین انسان و آفاتار انسان دیجیتال. توسعه یک TOIA خوب کار میکند، شامل چند منطقه تحقیقات است: هوشهای هنری، تعامل کامپیوتر انسان و انسان، پرداخت زبان طبیعی، جواب سوال و سیستمهای گفتگو. اولین چالش اینه که یک روش احساسی برای جمع داده ها تعریف کنیم و مجموعه داده های مفید برای آموزش سیستم برای گرفتن بهترین پاسخ به سوال یک کاربر ایجاد کنیم. در این کاغذ، ما سه دسترسی اصلی را پیشنهاد میکنیم: یک روششناسی برای ایجاد پایگاه دانش برای TOIA، یک شرکت محاوره و پایگاههای بنیادی برای بازیابی پاسخهای یک برگشت. ما روششناسی را با استراتژی دو قدم توسعه میکنیم. اول، ما اجازه می دهیم که لیست آواتار سازندهها با توجه به جفتهای بصیرت، حدس بزنیم که چه سوالی ممکن است که یک کاربر به آواتار بپرسد. دوم، ما صحبت واقعی بین افراد تصادفی و سازنده آواتار را ثبت میکنیم. ما کورپوس گفتگوی مارگاریتا را برای جامعه تحقیقات در دسترسی می دهیم. این کورپوس پایگاه دانش را در شکل متن، ویدئو برای هر پاسخ و گفتگوهای مشخص می باشد.Abstract
Time-Offset Interaction Applications (TOIAs) ovat järjestelmiä, jotka simuloivat kasvokkain keskusteluja ihmisten ja digitaalisten ihmisten avatarien välillä, jotka on tallennettu aiemmin. Toimivan TOIA:n kehittäminen käsittää useita tutkimusalueita: tekoäly, ihmisen ja tietokoneen vuorovaikutus, luonnollisen kielen käsittely, kysymyksenvastaus ja dialogijärjestelmät. Ensimmäisenä haasteena on määritellä järkevä tiedonkeruumenetelmä ja luoda hyödyllisiä tietokokonaisuuksia järjestelmän kouluttamiseksi vastaamaan käyttäjän kysymykseen parhaiten. Tässä artikkelissa esitellään kolme keskeistä vastausta: menetelmä tietopohjan luomiseksi TOIA:lle, dialogikorpus ja peruslinjat yhden käännöksen vastaushaulle. Kehitämme menetelmän kaksivaiheisen strategian avulla. Ensin annamme avatar makerin listata pareja intuition perusteella, arvaten mitä mahdollisia kysymyksiä käyttäjä voi esittää avatarille. Toiseksi tallennamme todellisia dialogeja satunnaisten yksilöiden ja avatarin tekijän välillä. Annamme Margarita Dialogue Corpuksen tutkimusyhteisön käyttöön. Korpus koostuu tekstimuotoisesta tietopohjasta, kunkin vastauksen videoleikkeistä ja huomautuksilla varustetuista dialogeista.Abstract
Les applications d'interaction décalée dans le temps (TOIA) sont des systèmes qui simulent des conversations en face à face entre des humains et des avatars humains numériques enregistrés dans le passé. Le développement d'un TOIA performant implique plusieurs domaines de recherche : intelligence artificielle, interaction homme-machine, traitement du langage naturel, réponse aux questions et systèmes de dialogue. Les premiers défis consistent à définir une méthodologie sensée pour la collecte de données et à créer des ensembles de données utiles pour entraîner le système à obtenir la meilleure réponse à la question d'un utilisateur. Dans cet article, nous présentons trois contributions principales : une méthodologie pour créer la base de connaissances pour un TOIA, un corpus de dialogue et des lignes de base pour la récupération de réponses en un seul tour. Nous développons la méthodologie à l'aide d'une stratégie en deux étapes. Tout d'abord, nous laissons le créateur d'avatar lister les paires par intuition, en devinant quelles questions un utilisateur peut poser à l'avatar. Ensuite, nous enregistrons des dialogues réels entre des individus au hasard et le créateur d'avatars. Nous mettons le Margarita Dialogue Corpus à la disposition de la communauté des chercheurs. Ce corpus comprend la base de connaissances au format texte, les clips vidéo pour chaque réponse et les dialogues annotés.Abstract
Is córais iad Feidhmchláir Idirghníomhaíochta Fritháireamh Ama (TOIAanna) a shamhlaíonn comhráite duine le duine idir daoine agus abhatáranna daonna digiteacha a taifeadadh san am a chuaigh thart. Tá roinnt réimsí taighde i gceist le TOIA a fheidhmíonn go maith a fhorbairt: hintleachta saorga, idirghníomhaíocht daonna-ríomhaire, próiseáil teanga nádúrtha, freagairt ceisteanna, agus córais dialóige. Is iad na chéad dúshláin ná modheolaíocht inbhraite a shainiú do bhailiú sonraí agus tacair sonraí úsáideacha a chruthú chun an córas a oiliúint chun an freagra is fearr ar cheist úsáideora a fháil. Sa pháipéar seo, cuirimid i láthair trí phríomh-rannchuidiú: modheolaíocht chun an bonn eolais a chruthú le haghaidh TOIA, corpas idirphlé, agus bonnlínte le haghaidh aisghabhála freagraí aon-uaine. Forbraímid an mhodheolaíocht ag baint úsáide as straitéis dhá chéim. Ar an gcéad dul síos, ligimid don déantóir avatar péirí a liostú de réir intuition, ag tomhas na gceisteanna a d'fhéadfadh úsáideoir a chur ar an avatar. Ar an dara dul síos, déanaimid taifead ar idirphlé iarbhír idir daoine randamacha agus an déantóir avatar. Cuirimid an Margarita Dialogue Corpus ar fáil don phobal taighde. Cuimsíonn an corpas seo an bonn eolais i bhformáid téacs, na gearrthóga físe do gach freagra, agus na dialóga anótáilte.Abstract
Shiryoyin Ayuka na Shiryoyin Ayuka na Akwai da Akwai (TOIA) su zama na'ura masu daidaita mazaɓa-fusky a tsakanin mutum da digitalar mutane da aka rubuta a gaba. Kuƙara wani mai amfani da mai amfani da TOIA yana ƙunsa da filinaiki masu yawa: ma'anar aiki na fassarar aiki na kima, mai amfani da kwamfyutan mutum, aikin fassarar harshe na natura, mai tambaya, da na'urar zauren akwatin bayani. @ action: button Ga wannan takardan, Munã halatar da aikin bayani uku masu ƙaranci: metodi na ƙiƙiro bakin ilmi wa TOIA, da nau'in zauren zauren akwatin bayani, da bakin bayani wa masu motsa guda-turu. Tuna buɗe hanyoyi da wani takwai biyu. Kayya, za mu saka jerin mai samu'ar da aka samu da mazaɓa nau'i biyu, da gane da za'a tambaya wanne masu yiwuwa mai amfani da shi zuwa matafiyar. Piki, za'a rubũta zauren akwatin bayani masu gaskiya a tsakanin mutum da mai samun matafiyar da ke buƙata. Munã samar da Koruba na Dialog Margarita zuwa jamii Wannan nauyi na ƙunsa da maɓallin ilmi cikin tsarin matsayi, yana da kiyayen video wa kowace karɓar, da zauren akwatin bayani da aka yi taƙaita.Abstract
Time-Offset Interaction Applications (TOIAs) are systems that simulate face-to-face conversations between humans and digital human avatars recorded in the past. פיתוח TOIA פועל היטב כולל מספר אזורים מחקרים: אינטליגנציה מלאכותית, אינטראקציה אנושית-מחשב, עיבוד שפה טבעי, עניין שאלות, ומערכות דיאלוג. האתגרים הראשונים הם להגדיר מטודולוגיה הגיונית לאספת נתונים וליצור קבוצות נתונים שימושיים לאימון המערכת כדי להשיג את התשובה הטובה ביותר לשאלה של משתמש. בעיתון הזה, אנו מציגים שלושה תרומות ראשיות: מטודולוגיה לייצור את בסיס הידע עבור TOIA, קופוס דיאלוג, וקווי בסיס להשיג תשובה אחת. אנחנו מפתחים את המתודלוגיה באמצעות אסטרטגיה בשתי שלבים. ראשית, אנו נותנים לרשימה של יוצרי האווטרים זוגות באינטואיציה, לנחש אילו שאלות אפשריות משתמש יכול לשאול לאוטר. שנית, אנחנו מקליטים דיאלוגים אמיתיים בין אדם אקראי לבין יוצר האווטר. אנחנו מקבלים את גופוס הדיאלוג של מרגריטה זמין לקהילת המחקר. הקורפוס הזה מכיל את בסיס הידע בצורת טקסט, קליפים וידאו לכל תשובה, והדיאלוגים המכתבים.Abstract
टाइम-ऑफसेट इंटरैक्शन एप्लिकेशन (TOIA) वे सिस्टम हैं जो अतीत में दर्ज किए गए मनुष्यों और डिजिटल मानव अवतारों के बीच आमने-सामने की बातचीत का अनुकरण करते हैं। एक अच्छी तरह से काम करने वाले TOIA को विकसित करने में कई शोध क्षेत्र शामिल हैं: कृत्रिम बुद्धिमत्ता, मानव-कंप्यूटर इंटरैक्शन, प्राकृतिक भाषा प्रसंस्करण, प्रश्न उत्तर देना और संवाद प्रणाली। पहली चुनौतियां डेटा संग्रह के लिए एक समझदार पद्धति को परिभाषित करना और उपयोगकर्ता के प्रश्न का सबसे अच्छा उत्तर प्राप्त करने के लिए सिस्टम को प्रशिक्षित करने के लिए उपयोगी डेटा सेट बनाना है। इस पेपर में, हम तीन मुख्य योगदान प्रस्तुत करते हैं: एक TOIA के लिए ज्ञान आधार बनाने के लिए एक पद्धति, एक संवाद कॉर्पस, और एकल-बारी उत्तर पुनर्प्राप्ति के लिए बेसलाइन। हम दो-चरणीय रणनीति का उपयोग करके पद्धति विकसित करते हैं। सबसे पहले, हम अवतार निर्माता को अंतर्ज्ञान द्वारा जोड़े की सूची देते हैं, यह अनुमान लगाते हुए कि उपयोगकर्ता अवतार से क्या संभावित प्रश्न पूछ सकता है। दूसरा, हम यादृच्छिक व्यक्तियों और अवतार-निर्माता के बीच वास्तविक संवाद रिकॉर्ड करते हैं। हम मार्गरीटा संवाद कॉर्पस को अनुसंधान समुदाय के लिए उपलब्ध कराते हैं। इस कॉर्पस में पाठ प्रारूप में नॉलेज बेस, प्रत्येक उत्तर के लिए वीडियो क्लिप और एनोटेट किए गए संवाद शामिल हैं।Abstract
Prijave za interakciju vrijeme-Offset (TOIAs) su sustavi koji simuliraju razgovore s lica na lice između ljudskih i digitalnih ljudskih avatara zabilježenih u prošlosti. Razvoj dobro funkcioniranog TOIA uključuje nekoliko istraživačkih područja: umjetnost inteligencije, interakcija ljudskih kompjutera, prirodno obrađivanje jezika, odgovor na pitanja i dijalogski sustavi. Prvi izazovi su definirati osjetljivu metodologiju prikupljanja podataka i stvoriti korisne sete podataka za obuku sustava kako bi dobili najbolji odgovor na pitanje korisnika. U ovom papiru predstavljamo tri glavne doprinosa: metodologija za stvaranje znanja baze za TOIA, dijalogski korpus i osnovne linije za povratak odgovora na jednookret. Razvijamo metodologiju koristeći strategiju dva koraka. Prvo, dopustili smo popis avatarskih proizvođa ča po intuiciji, pretpostavljajući moguća pitanja koje korisnik može postaviti avataru. Drugo, snimamo stvarne dijaloge između nasumičnih pojedinaca i avatarskog proizvođača. Postavljamo korpus dialoga Margarite na raspolaganju istraživačkoj zajednici. Ovaj korpus sastoji bazu znanja u tekstu, video snimke za svaki odgovor, i annotirane dijaloge.Abstract
A Time-Offset Interaction Applications (TOIA) olyan rendszerek, amelyek szimulálják az emberek és a múltban rögzített digitális emberi avatárok közötti személyes beszélgetéseket. A jól működő TOIA kialakítása több kutatási területet is magában foglal: mesterséges intelligencia, ember-számítógép interakció, természetes nyelvfeldolgozás, kérdésválasztás és párbeszédrendszerek. Az első kihívások az adatgyűjtés ésszerű módszertanának meghatározása, valamint hasznos adatkészletek létrehozása a rendszer kiképzéséhez, hogy a felhasználó kérdésére a legjobb választ kapja. Ebben a tanulmányban három fő hozzájárulást mutatunk be: egy TOIA tudásbázisának létrehozásának módszertanát, egy párbeszédkorpuszt, valamint az egyfordulós válaszok lekérésének alapjait. A módszertant kétlépcsős stratégiával fejlesztjük ki. Először is hagyjuk, hogy az avatárkészítő lista ösztönzéssel párosítsa, kitalálva, milyen lehetséges kérdéseket tesz fel egy felhasználó az avatárnak. Másodszor, rögzítjük a valódi párbeszédeket véletlenszerű egyének és az avatár-készítő között. A Margarita Dialogue Corpust a kutatóközösség számára elérhetővé tesszük. Ez a korpusz magában foglalja a tudásbázist szöveges formátumban, az egyes válaszokhoz tartozó videoklipeket és a jegyzetelt párbeszédpaneleket.Abstract
Ժամանակի-օֆսեթ ինտերակցիոն ծրագրերը (TOAIs) համակարգեր են, որոնք սիմուլյացնում են մարդկանց և անցյալում ձայնագրված թվային մարդկային ավաթարների միջև գտնվող առջև առջև հաղորդակցվածքները: Լավ գործող TOAI-ի զարգացումը ներառում է մի քանի հետազոտության ոլորտներ՝ արհեստական ինտելեկտը, մարդկային-համակարգիչների փոխազդեցությունը, բնական լեզվի վերլուծումը, հարցերի պատասխանը և երկխոսային համակարգերը: Առաջին մարտահրավերները տվյալների հավաքածուի իմաստալից մեթոդոլոգիա սահմանելն է և օգտակար տվյալների համակարգը վարժեցնելու համար ստեղծելն օգտակար համակարգը օգտագործողի հարցին լավագույն պատասխան ստանալու համար: Այս թղթի մեջ մենք ներկայացնում ենք երեք հիմնական ներդրումներ. մեթոդոլոգիա, որը օգնում է ստեղծել TOAI-ի գիտելիքների հիմքը, խոսակցության կորպոս և հիմքեր մեկ անգամ պատասխան ստանալու համար: Մենք զարգանում ենք մեթոդոլոգիան, օգտագործելով երկու քայլ-քայլ ռազմավարություն: Առաջինը, մենք թույլ ենք տալիս արտադրողների ցանկը զույգ լինել ինտուիցիայի միջոցով, համոզելով, թե ինչ հնարավոր հարցեր կարող է օգտագործողը տալ արտադրողին: Երկրորդ, մենք ձայնագրում ենք պատահական անհատների և արտադրողի միջև իրական հաղորդակցություններ: Մենք Մարգարիտայի երկխումբի կորպուսը հասանելի ենք դարձնում հետազոտական համայնքի համար: Այս կորպոսը կազմում է տեքստի ձևով գտնվող գիտելիքների հիմքը, յուրաքանչյուր պատասխանի տեսահոլովակները և annoted պատմությունները:Abstract
Aplikasi Interaksi Time-Offset (TOIAs) adalah sistem yang simulasi percakapan wajah-wajah antara manusia dan avatar digital manusia yang direkam di masa lalu. Mengembangkan TOIA yang berfungsi dengan baik melibatkan beberapa bidang penelitian: intelijen buatan, interaksi manusia-komputer, proses bahasa alam, menjawab pertanyaan, dan sistem dialog. tantangan pertama adalah untuk mendefinisikan metodologi yang masuk akal untuk koleksi data dan untuk membuat set data berguna untuk melatih sistem untuk mendapatkan jawaban terbaik kepada pertanyaan pengguna. Dalam kertas ini, kami mempersembahkan tiga kontribusi utama: metodologi untuk menciptakan dasar pengetahuan untuk TOIA, sebuah dialog corpus, dan garis dasar untuk mendapatkan jawaban satu pusingan. Kami mengembangkan metodologi menggunakan strategi dua langkah. Pertama, kami membiarkan daftar pembuat avatar pasangan dengan intuisi, menebak apa pertanyaan yang mungkin seorang pengguna dapat menanyakan kepada avatar. Kedua, kita merekam dialog nyata antara individu acak dan pembuat avatar. Kami membuat Margarita Dialogue Corpus tersedia untuk komunitas penelitian. Korpus ini terdiri dari dasar pengetahuan dalam format teks, klip video untuk setiap jawaban, dan dialog yang dicatat.Abstract
Le applicazioni di interazione time-offset (TOIA) sono sistemi che simulano conversazioni faccia a faccia tra esseri umani e avatar umani digitali registrati in passato. Lo sviluppo di un TOIA ben funzionante coinvolge diverse aree di ricerca: intelligenza artificiale, interazione uomo-computer, elaborazione del linguaggio naturale, risposta alle domande e sistemi di dialogo. Le prime sfide sono definire una metodologia sensata per la raccolta dei dati e creare set di dati utili per formare il sistema a recuperare la risposta migliore alla domanda di un utente. In questo articolo presentiamo tre contributi principali: una metodologia per creare la base di conoscenza per un TOIA, un corpus di dialogo e linee di base per il recupero delle risposte a singolo turno. Sviluppiamo la metodologia utilizzando una strategia in due fasi. In primo luogo, lasciamo che l'elenco dei creatori di avatar si accoppia per intuizione, indovinando quali possibili domande un utente può porre all'avatar. In secondo luogo, registriamo dialoghi reali tra individui casuali e il creatore di avatar. Mettiamo il Margarita Dialogue Corpus a disposizione della comunità di ricerca. Questo corpus comprende la base di conoscenze in formato testo, i video clip per ogni risposta e i dialoghi annotati.Abstract
タイムオフ・インタラクション・アプリケーション( TOIA )は、過去に記録された人間とデジタルヒューマンアバターとの対面会話をシミュレートするシステムである。 うまく機能するToiaの開発には、人工知能、人間とコンピュータの相互作用、自然言語処理、質問への回答、対話システムなど、いくつかの研究領域が含まれます。 最初の課題は、データ収集のための合理的な方法論を定義し、ユーザーの質問に対する最良の回答を取得するためにシステムをトレーニングするための有用なデータセットを作成することです。 本稿では、TOIAのための知識ベースを作成するための方法論、対話コーパス、および単一ターン応答取得のためのベースラインの3つの主な貢献を紹介する。 私たちは、2段階の戦略を使用して方法論を開発します。 まず、ユーザーがアバターに尋ねる可能性のある質問を推測して、直感によってアバターメーカーリストをペアにします。 第二に、ランダムな個人とアバターメーカーとの実際の対話を記録します。 Margarita Dialogue Corpusを研究コミュニティに提供しています。 このコーパスは、テキスト形式のナレッジベース、各回答のビデオクリップ、および注釈付きのダイアログで構成されています。Abstract
Time-offset Jejaring Awak dhéwé sing perusahaan iku nggawe sistem sing luwih apik perusahaan kanggo nggawe data nggawe barang nggawe sistem sing beraksi kanggo nggawe barang apik dhéwé sak usukak Nang mapun iki, kita mudhaya tanggal telu nyumbang panjenengan: Ndang kebutuhan kanggo kebutuhan bok ilhamak kanggo TOIB, kebutuhan dialog kebutuhan, lan basa sampek kanggo kebutuhan langgar sampek. Awak dhéwé nggawe ngerasakno sistem iki bakal sampek. Awak dhéwé, ngéwé perusahaan akeh perusahaan karo perusahaan netwisian, dadi kapan ingkang sampeyan karo perusahaan seneng dipontong apakno. Pak-Pak, kita gekulakno dialog wis ana karo perusahaan sampeyan karo perusahaan-perusahaan Awakdhéwé nggawe Karpus Dialog kanggo kebebasan kanggo resmi. Cep iki amot karo akeh basa matan ning format teks, video kesalakno kanggo saben cebatir lan nganggo dialog yang anaraéAbstract
სისტემები, რომელიც ადამიანების და დიზიტალური ადამიანების აბატარების შორის სიმულაციას დაწერა. TOIA-ის გამოყენება უფრო მუშაობელი გამოყენება აქვს რამდენიმე პასუხი: კულატური ინტელექცია, ადამიანის-კომპუტერის ინტერქციაცია, სახური ენის პროცესი, კით პირველი გამოცდილებები არის მონაცემების კოლექციის შესაძლებელი მეტოლოგიის განსაზღვრება და გამოსახულებელი მონაცემების კოლექციისთვის შექმნა სისტემის განათლებისთვის საუკეთესო ამ დომენტში ჩვენ სამი მნიშვნელოვანი დამატებით: მეტოლოგია TOIA, დიალოგის კოპუსი და ერთ-ერთი გადასვლისთვის გადასვლისთვის გადასვლისთვის მეტოლოგია. ჩვენ მეტოდოლოგიას გავაკეთებთ ორ-კვადრატიის სტრატიგიის გამოყენებით. პირველად, ჩვენ დავატოვებთ ავარას შექმნარების სიტყვების ზოგი ინტეუციაზე, რომელიც შეიძლება იყოს შესაძლებელი კითხვები, რომელიც მომხმარებელი შეიძლება მეორე, ჩვენ რეალური დიალოგიები დავწეროთ გამოსაკუთრებული ადამიანების და ავარას შექმნის შორის. ჩვენ მარდარიტა დიალოგის კორპოსს გამოიყენებთ სწავლობის საზოგადოებაში. ეს კორპუს არის ტექსტის ფორმატების მეცნიერების ბაზი, ვიდეო კლიპები ყოველ პასუხისთვის და მონიშნული დიალოგიების განმავლობაში.Abstract
Уақыт жылжыту интерактивтік қолданбалары (TOIAs) бұрынғы жазылған адамдар мен цифрлық адамдар арасындағы сөйлейтін жүйелер. Бірнеше зерттеу аумақтарын жасау үшін бірнеше зерттеу аумақтары болады: көңіл интеллекті, адам- компьютер интерфейсі, табиғи тіл процессі, сұрақтар жауап беру және диалог жүйелері. Бірінші мәселелелер - деректерді жинақтау үшін сезімді методологияны анықтау жүйесінің оқыту үшін пайдаланушының сұрағына ең жақсы жауап беру үшін жүйесінің оқыту үшін пайдаланушы дер Бұл қағазда, біз үш негізгі қатынас келтіріп тұрмыз: TOIA, диалог корпус және жауап беру үшін білім негізгі жолдарын құру методологиясы. Біз методология екі қадам стратегиясын қолданып жасаймыз. Біріншіден, пайдаланушының avatar жасаушыларының тізіміне интузиясы бойынша екеуіне рұқсат береміз. Біріншіден пайдаланушының avatar ға сұрақтарын қай сұрақта Екіншіден, біз кездейсоқ адамдар мен avatar құрастырушысы арасындағы диалогтарды жазу. Маргарита диалогын зерттеу коммуникасына қол жеткізеді. Бұл корпус мәтін пішімінде білім негізін, әрбір жауап үшін видео клиптерін және белгіленген диалогтарды құрады.Abstract
시간편향 인터랙티브 애플리케이션(TOIA)은 인간과 과거에 기록된 디지털 인간 아바타 간 대면 대화를 시뮬레이션하는 시스템이다.기능이 좋은 TOIA 개발은 인공지능, 인간과 기계의 상호작용, 자연 언어 처리, 퀴즈와 대화 시스템 등 몇 가지 연구 분야와 관련된다.첫 번째 도전은 합리적인 데이터 수집 방법을 정의하고 유용한 데이터 집합을 만들어서 시스템이 사용자의 질문에 대한 최상의 답을 검색하도록 훈련하는 것이다.본고에서 우리는 TOIA를 위해 지식 라이브러리를 만드는 방법, 대화 자료 라이브러리와 단원 답안 검색의 기선을 세 가지 주요 공헌을 제시했다.우리는 두 가지 전략 개발 방법을 사용한다.우선 화신 제조자는 직감적으로 짝짓기를 열거해 사용자가 화신에게 어떤 질문을 할지 추측하도록 했다.둘째, 우리는 무작위 개체와 화신 제조자 간의 실제 대화를 기록했다.우리는 연구 지역사회에 마가리타 대화 자료 라이브러리를 제공한다.이 자료 라이브러리는 텍스트 형식의 지식 라이브러리, 모든 답안의 영상 단편, 주석이 있는 대화를 포함한다.Abstract
Laiko atšaukimo sąveikos programos (TOIAs) yra sistemos, kurios imituoja žmonių ir skaitmeninių žmogaus avatarų tarpusavio pokalbius, užregistruotus praeityje. Developing a well-functioning TOIA involves several research areas: artificial intelligence, human-computer interaction, natural language processing, question answering, and dialogue systems. Pirmieji uždaviniai – apibrėžti protingą duomenų rinkimo metodiką ir sukurti naudingus duomenų rinkinius sistemos mokymui geriausiam vartotojo klausimo atsakymui gauti. Šiame dokumente pristatome tris pagrindinius įnašus: žinių bazės TOIA kūrimo metodiką, dialogo korpusą ir vienkartinio atsakymo gavimo bazes. Vykdome metodiką naudojant dviejų etapų strategiją. Pirma, mes leidžiame avatar ų kūrėjų sąrašo poras intuicija, spėjus, kokius galimus klausimus naudotojas gali užduoti avatarui. Antra, užregistruojame tikrus dialogus tarp atsitiktinių asmenų ir avatar ų kūrėjo. Darome Margaritos dialogo korpusą prieinamą mokslinių tyrimų bendruomenei. This corpus comprises the knowledge base in text format, the video clips for each answer, and the annotated dialogues.Abstract
Интеракциони апликации за време-Offset (TOIAs) се системи кои симулираат разговори лице во лице помеѓу луѓето и дигиталните човечки аватари снимени во минатото. Развојувањето на добро функционална ТОИА вклучува неколку истражувачки области: вештачка интелигенција, интеракција помеѓу човек и компјутер, природно обработување јазик, одговори на прашања и дијалошки системи. Првите предизвици се да се дефинира разумна методологија за собирање податоци и да се создадат корисни податоци за обука на системот за добивање на најдобар одговор на прашањето на корисникот. Во овој документ, претставуваме три главни придонеси: методологија за создавање на базата на знаење за ТОИА, дијалог корпус и основни линии за добивање на одговор на еден круг. Ја развиваме методологијата користејќи стратегија од два чекори. Прво, дозволуваме аватарскиот создавач да се пари по интуиција, претпоставувајќи какви можни прашања корисникот може да постави на аватарот. Второ, снимаме вистински дијалози помеѓу случајни поединци и производителот на аватари. Го поставуваме корпусот за дијалог Маргарита на располагање на истражувачката заедница. Овој корпус ја сочинува базата на знаење во текст формат, видео клиповите за секој одговор и анотираните дијалози.Abstract
സമയ- ഓഫേറ്റ് ഇന്റര്സെറ്റ് പ്രയോഗങ്ങള് (ടോയിയാസ്) മുഖം മുഖം സംസാരിക്കുന്ന സിസ്റ്റമാണ് മനുഷ്യരും ഡിജിറ്റല് മനുഷ്യരുടെ ആവാ ടോയാവിനെ നന്നായി പ്രവര്ത്തിപ്പിക്കുന്നതില് പലതും പഠിപ്പിക്കുന്ന പ്രദേശങ്ങളില് ഉള്പ്പെടുത്തുന്നുണ്ട്: കൃത്രിമിക വിവേകജ ഒരു ഉപയോക്താവിന്റെ ചോദ്യത്തിന്റെ ഏറ്റവും നല്ല ഉത്തരമെടുക്കാന് സിസ്റ്റത്തെ പരിശീലിപ്പിക്കാന് ഉപയോക്താവിന്റെ ചോദ്യത്തിന ഈ പത്രത്തില് ഞങ്ങള് മൂന്നു പ്രധാനപ്പെട്ട വിവരങ്ങള് കൊണ്ടുവരുന്നു. ഒരു ടോയാവിന്റെ അറിവ് ബേസ് സൃഷ്ടിക്കുന്നതിനുള്ള ഒരു രീതി രണ്ട് പട്ടിയില് നിന്നും ഉപയോഗിച്ച് നമ്മള് രീതിയില് നിര്മ്മിക്കുന്നു. ആദ്യം, നമ്മള് ആവാതര് ഉണ്ടാക്കുന്നവന്റെ ലിസ്റ്റില് ജോട്ടുകാരെ അനുവദിക്കുന്നു, ഒരു ഉപയോക്താവിനോട് എന്ത് ചോ രണ്ടാമത്, നമ്മള് വ്യക്തിപരമായ വ്യക്തികള്ക്കും വേണ്ടിയുണ്ടാക്കുന്നവര്ക്കും തമ്മിലുള്ള സംസാരം റെക്ക നമ്മള് മാര്ഗേരിറ്റ ഡയലോഗ് കോര്പ്പുസിനെ പഠിപ്പിക്കുന്ന സമൂഹത്തിന് ലഭ്യമാക്കുന്നു. ഈ കോര്പ്പുസ് ടെക്സ്റ്റ് ഫോര്മാറ്റില് അറിവുള്ള ബേസ് ചേര്ക്കുന്നു, ഓരോ ഉത്തരം വീഡിയോ ക്ലിപ്പ് ചെയ്യുനAbstract
Цаг-Оффейт интерактив програм (TOIAs) нь өнгөрсөн үед хүн болон цифрийн хүний аватар хоорондын харилцааны тухай зурагтай системүүд юм. Үнэндээ сайн ажиллаж буй TOIA-г хөгжүүлэх нь олон судалгааны хэсэг: уран бүтээл, хүний-компьютерийн харилцаа, байгалийн хэл процесс, асуулт хариулт, диалог систем юм. Эхний сорилтууд нь өгөгдлийн цуглуулалтын мэдрэмжтэй методологийг тодорхойлж, системийг суралцах хэрэглэгчийн асуултын хамгийн сайн хариултыг авахын тулд хэрэгтэй өгөгдлийн багц бүтээх юм. Энэ цаасан дээр бид 3 үндсэн түлхүүр өгсөн: TOIA, диалог корпус болон нэг эргэлтийн хариулт авахын тулд мэдлэгтэй суурь бүтээх арга зам юм. Бид хоёр алхам стратегийг ашиглан методологийг хөгжүүлнэ. Эхлээд хэрэглэгчийн асуултууд аватар дээр юу асууж болох вэ гэдгийг ойлгох боломжтой. Хоёрт, бид санамсаргүй хүн болон аватар бүтээгчийн хоорондох диалогуудыг бичсэн. Маргарита диалогын корпус судалгааны нийгэмд ашиглаж чадна. Энэ корпус нь текст хэлбэрээр мэдлэг суурь, хариулт бүрт бичлэг клип, эсрэг диалогууд байдаг.Abstract
Aplikasi Interaksi Ofset Masa (TOIAs) adalah sistem yang simulasikan perbualan muka-muka antara manusia dan avatar manusia digital yang direkodkan di masa lalu. Kembangan TOIA berfungsi dengan baik melibatkan beberapa kawasan kajian: kecerdasan buatan, interaksi manusia-komputer, pemprosesan bahasa alam, jawapan soalan, dan sistem dialog. Tandakan pertama adalah untuk menentukan metodologi yang masuk akal untuk koleksi data dan untuk mencipta set data yang berguna untuk melatih sistem untuk mendapatkan jawapan terbaik kepada soalan pengguna. Dalam kertas ini, kami memperkenalkan tiga kontribusi utama: metodologi untuk mencipta pangkalan pengetahuan untuk TOIA, korpus dialog, dan garis dasar untuk mendapatkan jawapan satu pusingan. Kami mengembangkan metodologi menggunakan strategi dua langkah. Pertama, kita biarkan senarai pembuat avatar pasangan dengan intuisi, menebak apa soalan yang mungkin seorang pengguna boleh tanya kepada avatar. Kedua, kita rekod dialog sebenar antara individu rawak dan pembuat avatar. Kami membuat Margarita Dialogue Corpus tersedia untuk komuniti penyelidikan. This corpus comprises the knowledge base in text format, the video clips for each answer, and the annotated dialogues.Abstract
L-Applikazzjonijiet ta’ Interazzjoni Time-Offset (TOIAs) huma sistemi li jissimulaw konverżjonijiet wiċċ imb’wiċċ bejn il-bnedmin u avatari umani diġitali rreġistrati fil-passat. L-iżvilupp ta’ TOIA li taħdem tajjeb jinvolvi diversi oqsma ta’ riċerka: intelliġenza artifiċjali, interazzjoni bejn il-bniedem u l-kompjuter, ipproċessar naturali tal-lingwi, tweġiba għall-mistoqsijiet, u sistemi ta’ djalogu. L-ewwel sfidi huma li tiġi definita metodoloġija raġonevoli għall-ġbir tad-dejta u li jinħolqu settijiet ta’ dejta utli għat-taħriġ tas-sistema biex tinkiseb l-a ħjar tweġiba għall-mistoqsija tal-utent. F’dan id-dokument, qed nippreżentaw tliet kontribuzzjonijiet ewlenin: metodoloġija għall-ħolqien tal-bażi tal-għarfien għal TOIA, korpus ta’ djalogu, u linji bażi għall-kisba ta’ tweġiba b’dawr wieħed. We develop the methodology using a two-step strategy. L-ewwel nett, a ħna nħallu l-list a tal-manifatturi tal-avatar tgħaqqad b’intwizzjoni, u nħallu noħorġu x’mistoqsijiet possibbli li utent jista’ jistaqsi lill-avatar. It-tieni nett, nirreġistraw djalogi reali bejn individwi aleatorji u l-manifattur tal-avatar. Aħna nagħmlu l-Korp tad-Djalogu Margarita disponibbli għall-komunità tar-riċerka. Dan il-korpus jinkludi l-bażi tal-għarfien fil-format tat-test, il-video clips għal kull tweġiba, u d-djalogi annotati.Abstract
Time-Offset Interaction Applications (TOIA's) zijn systemen die face-to-face gesprekken simuleren tussen mensen en digitale menselijke avatars die in het verleden zijn opgenomen. Het ontwikkelen van een goed functionerend TOIA omvat verschillende onderzoeksgebieden: kunstmatige intelligentie, mens-computer interactie, natuurlijke taalverwerking, vragen beantwoorden en dialoogsystemen. De eerste uitdagingen zijn het definiëren van een zinvolle methodologie voor gegevensverzameling en het creëren van nuttige datasets voor het trainen van het systeem om het beste antwoord op de vraag van een gebruiker te vinden. In dit artikel presenteren we drie belangrijke bijdragen: een methodologie voor het creëren van de kennisbasis voor een TOIA, een dialoogcorpus en baselines voor single-turn antwoord retrieval. We ontwikkelen de methodologie met behulp van een tweestapsstrategie. Eerst laten we de avatar maker paren door intuïtie te raden welke mogelijke vragen een gebruiker aan de avatar kan stellen. Ten tweede nemen we echte dialogen op tussen willekeurige individuen en de avatar-maker. We stellen het Margarita Dialogue Corpus beschikbaar voor de onderzoeksgemeenschap. Dit corpus bestaat uit de kennisbank in tekstformaat, de videoclips voor elk antwoord en de geannoteerde dialogen.Abstract
Tidsforskyvingsinteraksjonsprogrammer (TOIAs) er systemar som simulerer samtaler mellom menneske og digitale menneske avatare som er lagra i tidlegare. Utviklinga av ein godt funksjonell TOIA involverer fleire forskningsområde: kunstsiktig intelligens, menneskelige datamaskinesamsvar, naturspråkshandtering, spørsmålssvar og dialogsystemar. Den første utfordringane er å definera ein sensuelt metodologi for datasamlinga og laga nyttig datasett for opplæring av systemet for å henta den beste svara på spørsmålet til ein brukar. I denne papiret presenterer vi tre hovudbidrag: ein metodologi for å laga kunnskapsbasen for ein TOIA, ein dialogkorpus og baselinjer for å henta svar på enkelt område. Vi utviklar metodologien med ein to steg strategi. Først la vi list a over avatar-lagarar med intuisjon, gjeta kva moglege spørsmål ein brukar kan spørja til avatar. Andre, vi reknar opp faktiske dialogar mellom tilfeldige indikatora og avataropprettaren. Vi gjer korpusen for Margarita-dialogen tilgjengeleg for forskningssamfunnet. Denne korpusen inneheld kunnskapsbasen i tekstformatet, videoklippane for kvar svar og dialogvindauga som er merkte.Abstract
Aplikacje interakcji czasowej (TOIA) to systemy symulujące rozmowy twarzą w twarz między ludźmi a cyfrowymi ludzkimi avatarami rejestrowanymi w przeszłości. Opracowanie dobrze funkcjonującego TOIA obejmuje kilka obszarów badawczych: sztuczną inteligencję, interakcję człowiek-komputer, przetwarzanie języka naturalnego, odpowiadanie na pytania i systemy dialogu. Pierwszym wyzwaniem jest zdefiniowanie rozsądnej metodologii gromadzenia danych oraz stworzenie przydatnych zbiorów danych do szkolenia systemu w celu uzyskania najlepszej odpowiedzi na pytanie użytkownika. W niniejszym artykule przedstawiamy trzy główne wkłady: metodologię tworzenia bazy wiedzy dla TOIA, korpus dialogu oraz linie podstawowe do pobierania odpowiedzi w jednym turnie. Metodologię opracowujemy w oparciu o dwuetapową strategię. Po pierwsze, pozwalamy tworzyć listę par przez intuicję, zgadywając, jakie możliwe pytania użytkownik może zadać awatarowi. Po drugie, rejestrujemy rzeczywiste dialogi między przypadkowymi osobami a twórcą awatarów. Udostępniamy Korpus Dialogu Margarita dla środowiska naukowego. Korpus ten składa się z bazy wiedzy w formacie tekstowym, klipów wideo dla każdej odpowiedzi oraz z adnotacjami dialogowymi.Abstract
Os aplicativos de interação com compensação de tempo (TOIAs) são sistemas que simulam conversas face a face entre humanos e avatares humanos digitais gravados no passado. O desenvolvimento de um TOIA que funcione bem envolve várias áreas de pesquisa: inteligência artificial, interação humano-computador, processamento de linguagem natural, resposta a perguntas e sistemas de diálogo. Os primeiros desafios são definir uma metodologia sensata para coleta de dados e criar conjuntos de dados úteis para treinar o sistema para recuperar a melhor resposta para a pergunta de um usuário. Neste artigo, apresentamos três contribuições principais: uma metodologia para criar a base de conhecimento para um TOIA, um corpus de diálogo e linhas de base para recuperação de respostas em turno único. Desenvolvemos a metodologia usando uma estratégia de duas etapas. Primeiro, deixamos o criador do avatar listar os pares por intuição, adivinhando quais possíveis perguntas um usuário pode fazer ao avatar. Em segundo lugar, registramos diálogos reais entre indivíduos aleatórios e o criador de avatares. Disponibilizamos o Corpus de Diálogo Margarita para a comunidade de pesquisa. Esse corpus compreende a base de conhecimento em formato de texto, os videoclipes de cada resposta e os diálogos anotados.Abstract
Aplicațiile Time-Offset Interaction Applications (TOIA) sunt sisteme care simulează conversațiile față în față între oameni și avatarele umane digitale înregistrate în trecut. Dezvoltarea unui TOIA bine funcțional implică mai multe domenii de cercetare: inteligență artificială, interacțiune om-calculator, procesarea limbajului natural, răspunsul la întrebări și sisteme de dialog. Primele provocări sunt definirea unei metodologii rezonabile pentru colectarea datelor și crearea unor seturi de date utile pentru instruirea sistemului în vederea obținerii celui mai bun răspuns la întrebarea unui utilizator. În această lucrare, prezentăm trei contribuții principale: o metodologie pentru crearea bazei de cunoștințe pentru un TOIA, un corpus de dialog și linii de bază pentru recuperarea răspunsurilor cu un singur rând. Dezvoltăm metodologia folosind o strategie în două etape. În primul rând, lăsăm lista creatorului de avatar perechi prin intuiție, ghicind ce întrebări posibile un utilizator poate adresa avatarului. În al doilea rând, înregistrăm dialoguri reale între indivizi aleatorii și creatorul avatarului. Punem Corpul Dialogului Margarita la dispoziția comunității de cercetare. Acest corpus cuprinde baza de cunoștințe în format text, clipurile video pentru fiecare răspuns și dialogurile adnotate.Abstract
Приложения взаимодействия с вычетом времени (TOIA) - это системы, которые имитируют очные разговоры между людьми и цифровыми аватарами человека, записанными в прошлом. Разработка хорошо функционирующей TOIA включает несколько исследовательских областей: искусственный интеллект, взаимодействие человека с компьютером, обработка естественного языка, ответы на вопросы и системы диалога. Первыми задачами являются определение разумной методологии сбора данных и создание полезных наборов данных для обучения системы получению наилучшего ответа на вопрос пользователя. В настоящем документе мы представляем три основных вклада: методологию создания базы знаний для TOIA, корпус диалога и исходные данные для одновиткового поиска ответов. Мы разрабатываем методологию, используя двухэтапную стратегию. Во-первых, мы позволяем составителю списка аватаров по интуиции, угадывая, какие возможные вопросы пользователь может задать аватару. Во-вторых, мы записываем реальные диалоги между случайными людьми и создателем аватаров. Мы делаем Margarita Dialogue Corpus доступным для исследовательского сообщества. Этот корпус состоит из базы знаний в текстовом формате, видеоклипов для каждого ответа и аннотированных диалогов.Abstract
මිනිස්සුන් සහ ඩිජිටල් මිනිස්සුන් අවස්ථාවක් අතර සම්බන්ධ වැඩසටහන් අනුව (TOIAs) පද්ධතිය යුද්ධතිය යුද්ධතියි හොඳ ක්රියාත්මක විශ්වාස කරනවා TOIA විශ්වාස කරනවා විශ්වාස ක්රියාත්මක විශ්වාස කරනවා: ක්රියාත්මක බුද්ධිමත්, මි පළමු ප්රශ්නයක් තමයි තොරතුරු සංගීතය සඳහා හොඳම උත්තර ප්රශ්නයක් ලැබීමට පද්ධතියට ප්රශ්නය කරන්න ප්රයෝජනය සඳහා ප මේ පත්තරේ අපි ප්රධාන සදහස් තුනක් පෙන්වන්නේ: TOIA ගැන දන්නම් අධාර්යය හොයාගන්න, සංවාද කොර්පුස් සහ ප්රධාන ප්රතිකා අපි පැත්තක් දෙකක් පරීක්ෂණයක් පාවිච්චි කරනවා. මුලින්ම, අපි අවතාර් නිර්මාණය කරපු ලැයිස්තුව දෙන්න පුළුවන් ප්රශ්නයක් අවතාරුවෙන් අහන්න පුළුවන් ප දෙවෙනි විදියට, අපි ඇත්තටම සංවාදය සහ අවාතාර් නිර්මාණකය අතර ප්රතිකාර කරනවා. අපි මාර්ගාරිතා සංවාදය කොර්පුස් විදිහට පරීක්ෂණ සමාජයෙන්ට පුළුවන් වෙනවා. මේ කෝර්පස් එක්ක දන්නවන අධ්යය පාළුවට, විඩියෝ ක්ලිප්ස් එක්ක හැම ප්රතිචාරයක්ම සහ ප්රතිචාරණAbstract
Time-Offset Interaction Applications (TOIA) so sistemi, ki simulirajo oči v oči pogovore med ljudmi in digitalnimi človeškimi avatarji, posnetimi v preteklosti. Razvoj dobro delujočega TOIA vključuje več raziskovalnih področij: umetno inteligenco, interakcijo med človekom in računalnikom, obdelavo naravnega jezika, odgovarjanje na vprašanja in sisteme dialoga. Prvi izzivi so opredelitev razumne metodologije za zbiranje podatkov in ustvarjanje uporabnih podatkovnih nizov za usposabljanje sistema za pridobitev najboljšega odgovora na uporabnikovo vprašanje. V prispevku predstavljamo tri glavne prispevke: metodologijo za ustvarjanje baze znanja za TOIA, korpus dialoga in osnovne linije za pridobivanje odgovorov z enim obratom. Metodologijo razvijamo z uporabo dvostopenjske strategije. Najprej pustimo, da se izdelovalec avatarja seznamuje po intuiciji in ugibamo, kakšna možna vprašanja lahko uporabnik postavi avatarju. Drugič, snemamo dejanske dialoge med naključnimi posamezniki in ustvarjalcem avatarjev. Raziskovalni skupnosti dajemo korpus za dialog z margarito. Ta korpus obsega bazo znanja v besedilni obliki, videoposnetke za vsak odgovor in pogovorna okna z oznakami.Abstract
Xilliga-Offset Interaction Applications (TOIA) waa nidaam u similaya hadalka wejiyada ee u dhexeeya dadka iyo macluumaadka digital dadka ee horay lagu qoray. Horumarinta qoraal aad u shaqeeya TOIA waxaa ka mid ah meelo waxbarasho oo kala duduwan: cilmiga farshaxanka, iskala xiriirka kambiyuutarka, baaraandegista afka dabiicadda ah, jawaabta su'aalka iyo nidaamka dialogka. Shaqooyinka ugu horreeya waa in loo sawiraa qaab aad u sahlan karo ururada macluumaadka iyo in loo sameeyo koorasyo faa’iido leh oo lagu barto nidaamka si aad ugu jawaabto su'aalka ugu fiican ee isticmaalaha. Warqadan waxaan ku qornaa sadex kharash oo muhiim ah: qaab u ah in loo abuuro aasaaska aqoonta oo loo sameynayo TOIA, qalabka dialog, iyo saldhigyo ku saabsan helitaanka jawaabta hal jeer ah. Waxaynu horumarinaa qaababka isticmaalka qoraal labaad. Marka ugu horeysa, waxaynu ku daynaa macluumaadka qofka sameynaya macluumaadka, waxaynu ka fekeraynaa su'aalaha suurtagalka ah in uu isticmaaluhu weydiin karo macluumaadka. Second, waxaynu soo qoraynaa dialogue rasmi ah oo u dhexeeya shakhsiyada iyo sameynta avatar. Waxaynu korpus ka dhigaynaa baaritaanka Margarita. Kanu wuxuu ku qoran yahay saldhigga aqoonta foomka macluumaadka, fiidiyowga waxaa lagu qeybiyaa jawaab kasta iyo diyaarinta la sharciyey.Abstract
Aplikatat e ndërveprimeve "Time-Offset" (TOIAs) janë sisteme që simulojnë bisedimet fytyrë në fytyrë midis njerëzve dhe avatarëve dixhitale njerëzore të regjistruar në të kaluarën. Zhvillimi i një TOIA që funksionon mirë përfshin disa fusha kërkimi: inteligjencë artificiale, ndërveprim njerëzor-kompjuter, përpunim natyror gjuhësh, përgjigje pyetjesh dhe sisteme dialogu. Sfidat e para janë të përcaktohet një metodologji e arsyeshme për mbledhjen e të dhënave dhe të krijohen grupe të dhënash të dobishme për trajnimin e sistemit për të marrë përgjigjen më të mirë ndaj pyetjes s ë një përdoruesi. Në këtë letër, ne paraqesim tre kontribute kryesore: një metodologji për krijimin e bazës së njohurive për një TOIA, një korpus dialog dhe linja bazë për marrjen e përgjigjeve me një kthesë të vetme. We develop the methodology using a two-step strategy. Së pari, ne lejojmë që krijuesit e avatarit të paraqiten sipas intuicionit, duke menduar se cilat pyetje të mundshme që një përdorues mund t'i bëjë avatarit. Së dyti, ne regjistrojmë dialoget reale midis individëve të rastësishëm dhe krijuesit të avatarit. Ne e bëjmë Korpin e Dialogut të Margaritës në dispozicion për komunitetin kërkimor. Ky korpus përfshin bazën e njohurive në format teksti, videoklipet për çdo përgjigje dhe dialogun e anotuar.Abstract
Prijave o interakciji vremena-Offset (TOIAs) su sistemi koji simuliraju razgovore sa licem na lice između ljudskih i digitalnih ljudskih avatara zabilježenih u prošlosti. Razvoj dobro funkcioniranog TOIA uključuje nekoliko istraživačkih područja: umjetnost inteligencije, interakcija ljudskih kompjutera, prirodno obrađivanje jezika, odgovor na pitanja i dijalog. Prvi izazov je definisati razumnu metodologiju za kolekciju podataka i stvoriti korisne sete podataka za obuku sistema kako bi dobio najbolji odgovor na pitanje korisnika. U ovom papiru predstavljamo tri glavne doprinosa: metodologija za stvaranje znanja baze za TOIA, dijalogski korpus i osnovne linije za povratak odgovora na jednookret. Razvijamo metodologiju koristeći strategiju dva koraka. Prvo smo dozvolili da popis avatarskih proizvođa ča postave par intuicije, pretpostavljajući moguća pitanja koje korisnik može postaviti avataru. Drugo, snimamo prave dijaloge između nasumičnih pojedinaca i avatarskog proizvođača. Postavljamo korpus dialoga Margarite na raspolaganju istraživačkoj zajednici. Ovaj korpus sastoji bazu znanja u tekstu, video snimke za svaki odgovor i annotirane dijaloge.Abstract
Time-Offset Interaction Applications (TOIA) är system som simulerar ansikte mot ansikte samtal mellan människor och digitala mänskliga avatarer inspelade tidigare. Att utveckla en välfungerande TOIA omfattar flera forskningsområden: artificiell intelligens, människa-dator interaktion, naturlig språkbehandling, frågesvar och dialogsystem. De första utmaningarna är att definiera en förnuftig metod för datainsamling och att skapa användbara datauppsättningar för att utbilda systemet för att få det bästa svaret på en användares fråga. I den här uppsatsen presenterar vi tre huvudbidrag: en metod för att skapa kunskapsbasen för en TOIA, en dialogkorpus och baslinjer för enkel svarsökning. Vi utvecklar metodiken med hjälp av en tvåstegsstrategi. Först låter vi avatartillverkarens lista para sig genom intuition, gissa vilka möjliga frågor en användare kan ställa till avataren. För det andra spelar vi in faktiska dialoger mellan slumpmässiga individer och avatarskaparen. Vi gör Margarita Dialogue Corpus tillgänglig för forskarsamhället. Denna korpus består av kunskapsbasen i textformat, videoklippen för varje svar och kommenterade dialoger.Abstract
Time-Offset Interaction Applications (TOIAs) are systems that simulate face-to-face conversations between humans and digital human avatars recorded in the past. Kutengeneza kazi nzuri ya TOIA inahusisha maeneo kadhaa ya utafiti: akili halisi, mahusiano ya kompyuta ya binadamu, upasuaji wa lugha asili, majibu ya maswali, na mfumo wa mazungumzo. Changamoto la kwanza ni kuelezea njia yenye ufanisi wa kukusanya taarifa na kutengeneza seti za data yenye manufaa kwa ajili ya kufundisha mfumo ili kupata jibu bora zaidi kwa swali la mtumiaji. Katika karatasi hii, tunatoa michango makuu matatu: mbinu ya kutengeneza msingi wa maarifa kwa ajili ya TOIA, makampuni ya mazungumzo, na misingi ya kurejea jibu moja kwa moja. Tunaendeleza mbinu kwa kutumia mkakati wa hatua mbili. Kwanza, tunaruhusu watengenezaji orodha ya watengenezaji wawili kwa ufahamu, tunafikiri ni nini kinachowezekana mtumiaji anaweza kuuliza mashine hiyo. Pili, tunarekodi mazungumzo halisi kati ya watu binafsi na watengenezaji mashine. Tunafanya chombo cha Dialogu ya Margarita kinapatikana kwa jamii ya utafiti. Kampuni hii inajumuisha msingi wa maarifa kwa mfumo wa maandishi, video zinazipiga kwa kila jibu, na mazungumzo yanayotajwa.Abstract
நேரம்- Offset Interaction Applications (TOIA) are systems that simulate the face-to-face conversations between humans and digital human avatars before recorded. TOIA செயல்படுத்தல் நன்றாக செயல்படுத்தல் பல ஆராய்ச்சி பகுதிகளுக்குச் சேர்க்கப்படுகிறது: கலைஞர் புலன், மனித கணினி இடைவெளியீடு, இயற்கையான மொ முதல் சவால்கள் தகவல் தொகுப்பிற்கு உணர்வு முறைமையை வரையறுக்க மற்றும் கணினியை பயிற்சிக்க பயனுள்ள தகவல் அமைப்புகளை உருவாக்குவதற்கா இந்த காகிதத்தில், நாம் மூன்று முக்கிய பங்களை கொடுக்கிறோம்: TOIA க்கான அறிவு தளத்தை உருவாக்க ஒரு முறைமையாக்கம், ஒரு உரையாடல் குறியீ இரண்டு படி திட்டத்தை பயன்படுத்தி முறைமையை உருவாக்குகிறோம். முதலில், நாம் ஏவேடார் உருவாக்குபவர் பட்டியல் ஜோடிகளை அறிவிப்பால் அனுமதிக்க விடுகிறோம், பயனர் avatar கேட்க முடியும Second, we record actual dialogues between random individuals and the avatar-maker. நாம் மார்கேரிட்டா உரையாடல் கார்புஸ் ஆராய்ச்சி சமூகத்திற்கு கிடைக்கும். இந்த கார்புஸ் உரை வடிவத்தில் அறிவிப்பு அடிப்படையை சேர்க்கும், ஒவ்வொரு விடைக்கும் வீடியோ கிளிப்புகள் மற்றுமAbstract
Zaman-Offset Interaksiyon Uygulamaları (TOIAs) geçmişte kayıtlı insanlar ve dijital adamlar arasında görüşmeleri simülatýarlar. Gowy işlenýän TOIA öwrenmek birnäçe araşdyrma alanlarynda: sungaty intellekt, adam-kompýuter etkileşimi, tebigy diller işleýäni, soraglaryň jogaplary we dialoglar sistemalary bar. Ilkinji kynçylyklar, maglumat koleksiýasy üçin a ňsatly methodologiýany bejermek we sistemiň üýtgetmesi üçin ullanýan maglumat düzümlerini bejermek üçin ullanýar. Bu kagyzda üç sany esasy täsiri görkezip berýäris: TOIA bilem üssünü bejermek üçin bir methodologiýa, dialogy korpus we ýekeje gezek jogaby almak üçin beýleki çyzgytlar bar. Biz metodologiýany iki adım stratejiýany ulanyp gelişýäris. Ilkinji gezek, avatar düzenleyicileriniň görkezilişi bilen çift sanlaryny rugsat berdik. Ullançylaryň avatar üçin näme soraglary sorap biljekdigini tahmin edip bilýäris. Ikinjisi, sanly adamlar we avatar düzenleyicileriniñ arasynda çykyş dialoglary ýazylýarys Biz çykyş jemgyýetiniň Margarita dialogy köpüsini tapýarys. Bu korpus her cevap için bilim tabanını metin biçiminde, video kliplerini ve nöbetlenen dialoglarda oluşturur.Abstract
Time-Offset Interaction Applications (TOIAs) ایسے سیستم ہیں جو پہلے لوگوں اور ڈیجیٹل انسان آواٹاروں کے درمیان مکالمات سیمولیٹ کر رہے ہیں۔ ایک اچھی فعالیت کرنے والی TOIA کی توسعہ میں بہت سی تحقیقات کے منطقه میں شامل ہوتی ہے: آرٹیفٹی بصیرت، انسان-کمپیوٹر کی تعامل، طبیعی زبان پردازی، سوال جواب، اور диалог سیستم. پہلی چالوں کی تعریف ہے کہ ڈیٹ کالکتر کے لئے ایک حساس طریقہ کا مقرر کریں اور سیسٹم کی تعریف کے لئے بہترین جواب حاصل کرنے کے لئے مفید ڈیٹ سٹ بنائیں۔ اس کاغذ میں ہم تین اصلی حصہ پیش کرتے ہیں: TOIA کے لئے علم کی بنیاد بنانے کے لئے ایک طریقہ ہے، ایک ڈالگو کورپوس، اور ایک واپس کی جواب حاصل کرنے کے لئے بنیاد لین۔ ہم اس طریقہ کو دو قدم استراتژی کے مطابق تخلیق کرتے ہیں۔ پہلے، ہم نے آواٹر بنانے والوں کی لکھ دو جوڑے کو اجازت دی، مطلب کریں کہ ایک کاربر نے آواٹر سے کیا سوال کرسکے؟ دوسرا، ہم تصادفی آدمیوں اور آواٹر مکرین کے درمیان حقیقی диалог ریکورد کرتے ہیں. ہم نے مارگاریٹا ڈالیلوگ کورپوس کو تحقیق کمونٹی کے لئے موجود بنایا ہے. This corpus contains the knowledge base in text format, the video clips for each answer, and the annotated dialogs.Abstract
Name TOIA yaxshi ishlaydigan bir necha taʼminlovchi maydonlarni taʼminlovchi darajaga ega: ijodkorlik intellekt, binadam kompyuterning interfeys, tabiiy tilni boshqarish, savol javob berish, va dialog tizimi. @ info Bu qogʻozda biz uchta asosiy qandaydir qilamiz: TOIA uchun ilmiy bazasini yaratish usuli, muloqat kopusi, va bir necha kelib javob olish uchun asosiy. We develop the methodology using a two-step strategy. Birinchi so'zda, avatar yaratuvchi roʻyxati qo'lingizga ruxsat beramiz, foydalanuvchi avatarga nima savol berishi mumkin deb o'ylaymiz. Ikkinchi so'zda, biz shaxsiy odamlar va avatar yaratuvchilar orasidagi muloqatlarni yozib boramiz. Biz Margarita Dialog Korpusni tahrirlash jamoasi uchun imkoniyat qilamiz. NameAbstract
Các ứng dụng tương tác vượt thời gian (TOIAs) là những hệ thống mô phỏng cuộc đối mặt thoại giữa con người và các Avatar người số được ghi lại trong quá khứ. Việc phát triển TOIA thuận lợi liên quan đến nhiều lĩnh vực nghiên cứu: trí tuệ nhân tạo, giao tiếp máy tính, xử lý ngôn ngữ tự nhiên, câu hỏi đáp trả, và hệ thống đối thoại. Những thử thách đầu tiên là phải xác định một phương pháp nhạy cảm để thu thập dữ liệu và tạo ra những bộ dữ liệu hữu ích để huấn luyện hệ thống để lấy câu trả lời tốt nhất cho câu hỏi của người dùng. Trong tờ giấy này, chúng tôi đưa ra ba đóng góp chính: một phương pháp để tạo ra căn cứ kiến thức cho TOIA, một tập đoàn đối thoại, và cơ sở cơ bản để lấy câu trả lời một lượt. Chúng tôi phát triển phương pháp bằng một chiến lược hai bước. Đầu tiên, chúng ta để máy tạo Avatar liệt kê từng cặp theo trực giác, đoán xem những câu hỏi mà người dùng có thể hỏi Avatar. Thứ hai, chúng ta ghi lại các cuộc đối thoại giữa các cá nhân ngẫu nhiên và Avatar-máy. Chúng tôi sẽ công bố các Tập đoàn đối thoại Margarita cho cộng đồng nghiên cứu. Tập đoàn này bao gồm cơ sở kiến thức theo dạng văn bản, đoạn video cho mỗi câu trả lời, và các ca thoại được ghi chú.Abstract
时偏交互应用程序(TOIA)拟旧记人物化身之间对语之统也。 开功良TOIA及数治域:人工智能,人机交互,自然语言处分,问答系统。 首挑战为数收定义一理之法,并创有用之数集来训练系统以检用户之最佳答案。 本文三要:为TOIA创知识库之法,对语料库单轮检索之基线。 我们用两步策开发方法。 先令头像制作者凭直觉列配对,意用户或有所发。 次记随机个体与化身造者实对。 供玛格丽塔语料库。 其语料库文本格式知识库、对案视频剪辑带注对。- Anthology ID:
- 2020.lrec-1.60
- Volume:
- Proceedings of the 12th Language Resources and Evaluation Conference
- Month:
- May
- Year:
- 2020
- Address:
- Marseille, France
- Venue:
- LREC
- SIG:
- Publisher:
- European Language Resources Association
- Note:
- Pages:
- 476–484
- Language:
- English
- URL:
- https://aclanthology.org/2020.lrec-1.60
- DOI:
- Bibkey:
- Cite (ACL):
- Alberto Chierici, Nizar Habash, and Margarita Bicec. 2020. The Margarita Dialogue Corpus : A Data Set for Time-Offset Interactions and Unstructured Dialogue Systems. In Proceedings of the 12th Language Resources and Evaluation Conference, pages 476–484, Marseille, France. European Language Resources Association.
- Cite (Informal):
- The Margarita Dialogue Corpus : A Data Set for Time-Offset Interactions and Unstructured Dialogue Systems (Chierici et al., LREC 2020)
- Copy Citation:
- PDF:
- https://aclanthology.org/2020.lrec-1.60.pdf
- Terminologies:
Export citation
@inproceedings{chierici-etal-2020-margarita, title = "The Margarita Dialogue Corpus : A Data Set for Time-Offset Interactions and Unstructured Dialogue Systems", author = "Chierici, Alberto and Habash, Nizar and Bicec, Margarita", booktitle = "Proceedings of the 12th Language Resources and Evaluation Conference", month = may, year = "2020", address = "Marseille, France", publisher = "European Language Resources Association", url = "https://aclanthology.org/2020.lrec-1.60", pages = "476--484", language = "English", ISBN = "979-10-95546-34-4", }
<?xml version="1.0" encoding="UTF-8"?> <modsCollection xmlns="http://www.loc.gov/mods/v3"> <mods ID="chierici-etal-2020-margarita"> <titleInfo> <title>The Margarita Dialogue Corpus : A Data Set for Time-Offset Interactions and Unstructured Dialogue Systems</title> </titleInfo> <name type="personal"> <namePart type="given">Alberto</namePart> <namePart type="family">Chierici</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Nizar</namePart> <namePart type="family">Habash</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Margarita</namePart> <namePart type="family">Bicec</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <originInfo> <dateIssued>2020-05</dateIssued> </originInfo> <typeOfResource>text</typeOfResource> <language> <languageTerm type="text">English</languageTerm> <languageTerm type="code" authority="iso639-2b">eng</languageTerm> </language> <relatedItem type="host"> <titleInfo> <title>Proceedings of the 12th Language Resources and Evaluation Conference</title> </titleInfo> <originInfo> <publisher>European Language Resources Association</publisher> <place> <placeTerm type="text">Marseille, France</placeTerm> </place> </originInfo> <genre authority="marcgt">conference publication</genre> <identifier type="isbn">979-10-95546-34-4</identifier> </relatedItem> <identifier type="citekey">chierici-etal-2020-margarita</identifier> <location> <url>https://aclanthology.org/2020.lrec-1.60</url> </location> <part> <date>2020-05</date> <extent unit="page"> <start>476</start> <end>484</end> </extent> </part> </mods> </modsCollection>
%0 Conference Proceedings %T The Margarita Dialogue Corpus : A Data Set for Time-Offset Interactions and Unstructured Dialogue Systems %A Chierici, Alberto %A Habash, Nizar %A Bicec, Margarita %S Proceedings of the 12th Language Resources and Evaluation Conference %D 2020 %8 May %I European Language Resources Association %C Marseille, France %@ 979-10-95546-34-4 %G English %F chierici-etal-2020-margarita %U https://aclanthology.org/2020.lrec-1.60 %P 476-484
Markdown (Informal)
[The Margarita Dialogue Corpus : A Data Set for Time-Offset Interactions and Unstructured Dialogue Systems](https://aclanthology.org/2020.lrec-1.60) (Chierici et al., LREC 2020)
- The Margarita Dialogue Corpus : A Data Set for Time-Offset Interactions and Unstructured Dialogue Systems (Chierici et al., LREC 2020)
ACL
- Alberto Chierici, Nizar Habash, and Margarita Bicec. 2020. The Margarita Dialogue Corpus : A Data Set for Time-Offset Interactions and Unstructured Dialogue Systems. In Proceedings of the 12th Language Resources and Evaluation Conference, pages 476–484, Marseille, France. European Language Resources Association.