Sentiment Analysis of Tunisian Dialects : Linguistic Ressources and ExperimentsTunisian Dialects: Linguistic Ressources and Experiments Sentiment Analyseer van Tunisiese Dialeksies: Linguistiese Ressources en Eksperimente Tunisian Dialects: Linguistic resource and Experiments تحليل المشاعر باللهجات التونسية: مصادر وتجارب لغوية Tunisya Diyal…Щl…Щrinin Sentiment Analizi: Linguistik Ressourcesi v…Щ Experiments Сентиментен анализ на тунизийските диалекти: лингвистични източници и експерименти তিউনিশিয়ার ডায়ালেকসের সেন্টাইমেন্ট বিশ্লেষণ: লিঙ্গিস্টিক উৎস এবং পরীক্ষা ཊུ་ནེ་ཤི་ཡཱན་སྟངས་བཀོལ་སྤྱོད་ཀྱི་ཆ་འཕྲིན་ལྟ་ཞིབ་བྱེད་པ། སྐད་རིག་གནས་སྟངས་དང་བརྟག་ཞིབ Sentiment Analysis of Tunisian Dialects: Linguistic Ressources and Experiments Anàlisi del Sentiment de les Dialectes Tunísienes: Ressources lingüístiques i experiments Sentimentní analýza tuniských dialektů: jazykové zdroje a experimenty Følelsesanalyse af tunesiske dialekter: sproglige ressourcer og eksperimenter Stimmungsanalyse tunesischer Dialekte: Sprachliche Quellen und Experimente Ανάλυση συναισθημάτων των Τυνησικών διαλέκτων: Γλωσσολογικές πηγές και πειράματα Análisis de sentimientos de los dialectos tunecinos: recursos y experimentos lingüísticos Tuneesia dialektide sentimentaalne analüüs: keelelised allikad ja eksperimendid تحلیل احساساتی از گزینش های تونیزی: منبع و تجربههای لینگویسی Tunisian dialektien tunneanalyysi: Kielelliset lähteet ja kokeet Analyse des sentiments des dialectes tunisiens : ressources et expériences linguistiques Anailís Mothúchán ar Chanúintí na Túinéise: Acmhainní agus Turgnaimh Teangeolaíochta Analyze of Tunisian Dials: Linguistic resource and Experiments Analysis of Sentiment of Tunisian Dialects: Language Resources and Experiments ट्यूनीशियाई बोलियों की भावना विश्लेषण: भाषाई Ressources और प्रयोगों Sentiment Analysis of Tunisian Dialects: Linguistic Ressources and Experiments Tunéziai dialektusok hangulatelemzése: Nyelvi források és kísérletek Թունիսական դիալեկտների զգացմունքային վերլուծությունը. լեզվային ռեսուրսներ և փորձեր Analisi Sentiment Dialeks Tunisia: Sumber Bahasa dan Eksperimen Analisi sentimentale dei dialetti tunisini: risorse linguistiche ed esperimenti チュニジア方言の感情分析:言語資源と実験 Sentiment ტუნისური დიალექტის შეცდომა ანალიზაცია: ლინგუტიური რესფორსები და ექსპერიმენტები Тунис диалекцияларының Sentiment Analysis of Sentiment: Linguistic Resources and Experiments 튀니지 사투리의 감정 분석: 언어 자원과 실험 Tuniso dialektų jautrumo analizė: kalbiniai ištekliai ir eksperimentai Анализа на чувствата на туниските дијалекти: Лингвистички ресурси и експерименти ട്രൂണിഷ്യന് ഡയലക്ടറുകളുടെ സെന്റിമെന്റ് അന്വേഷണം: ലിങ്ഗിസ്റ്റിക് വിഭവങ്ങളും പരീക്ഷണങ്ങളും Тунисийн шалгалтын мэдрэмжтэй шинжилгээ Analisi Sentiment Dialeks Tunisia: Sumber dan Eksperimen Bahasa Analiżi tas-Sentiment tad-Dijaletti Tuneżini: Riżorsi Lingwistiċi u Esperimenti Sentimentanalyse van Tunesische dialecten: Taalkundige bronnen en experimenten Sentiment analyse av tunisiske dialektar: Lingvis ressursar og eksperimenter Analiza sentymentów dialektów tunezyjskich: źródła językowe i eksperymenty Análise de sentimentos dos dialetos tunisianos: recursos linguísticos e experimentos Analiza sentimentelor dialectelor tunisiene: Resurse lingvistice și experimente Анализ настроений тунисских диалектов: лингвистические источники и эксперименты Name Sentimentalna analiza tunizijskih dialektov: jezikovni viri in eksperimenti Sentiment Analysis of Tunisian Dialects: Linguistic Resources and Experiments Analiza e ndjenjave e dialekteve tuniziane: Burime dhe eksperimente gjuhësore Sentiment Analysis of Tunisian Dialects: Linguistic Ressources and Experiments Känsleanalys av tunisiska dialekter: Språkliga resurser och experiment Uchambuzi wa Sentiment of Tunisia Dialects: Sources of Linguistics and Experiments Tunisian Dialects: Linguistic Resources and Experiments Tünez Diýseçmelerinin Sentiment Analizi: Dilli Kaynaklar we Testler ٹونیسی ڈائیلٹس کی سنٹیمینٹ تحلیل: لینگویسٹ رسسورس اور تجربے Tunisiya Dialects: Linguistic Resources and Experiments Bản phân tích ngôn ngữ học và thử nghiệm của Tunisia 突尼斯方言之情析:言资实验
Salima Medhaffar, Fethi Bougares, Yannick Estève, Lamia Hadrich-Belguith
Abstract
Dialectal Arabic (DA) is significantly different from the Arabic language taught in schools and used in written communication and formal speech (broadcast news, religion, politics, etc.). There are many existing researches in the field of Arabic language Sentiment Analysis (SA) ; however, they are generally restricted to Modern Standard Arabic (MSA) or some dialects of economic or political interest. In this paper we are interested in the SA of the Tunisian Dialect. We utilize Machine Learning techniques to determine the polarity of comments written in Tunisian Dialect. First, we evaluate the SA systems performances with models trained using freely available MSA and Multi-dialectal data sets. We then collect and annotate a Tunisian Dialect corpus of 17.000 comments from Facebook. This corpus allows us a significant accuracy improvement compared to the best model trained on other Arabic dialects or MSA data. We believe that this first freely available corpus will be valuable to researchers working in the field of Tunisian Sentiment Analysis and similar areas.Abstract
Dialekteel Arabiese (DA) is betekeurig verskillende van die Arabiese taal leer in skole en gebruik in skriftelike kommunikasie en formele spreek (uitsaaiding nuus, reliëf, politiek, ensfh.). Daar is baie bestaande resekers in die veld van Arabiese taal Sentiment Analysis (SA); maar hulle is algemeen beheinde aan Moderne Standaard Arabs (MSA) of sommige dialekte van ekonomiese of politiese belang. In hierdie papier is ons geinteresseer in die SA van die Tunisiese Dialeksie. Ons gebruik masjien leer teknike om die polarisie van kommentaar in Tunisië geskrywe te bepaal. Eerste, ons evalueer die SA stelselspeletjies met modele wat opgelei word deur vry beskikbaar MSA en Multi-dialektiese data stelle te gebruik. Ons versamel dan en annoteer 'n Tunisiese Dialect corpus van 17.000 kommentaar van Facebook. Hierdie korpus laat ons toe 'n betekende presisie verbetering vergelyk met die beste model wat op ander Arabiese dialekte of MSA data opgelei is. Ons glo dat hierdie eerste vry beskikbaar korpus waardelik sal wees om resekers te werk in die veld van Tunisië Sentiment Analysis en gelyke areas.Abstract
ዳሌክቻል ዐረብኛ (DA) በተምህርት ትምህርት ውስጥ ከሚያስተምሩ ዐረብኛ ቋንቋ እጅግ የተለየ ነው፡፡ በዐረብኛ ቋንቋ ሳንተርሚናል (SA) እርሻ ውስጥ ብዙ ምርመራዎች አሉ፡ ምንም እንኳን፣ አዲስ የአሁኑ የአርባቢ ደናዳዊ ዐረብኛ (አሜሲ) ወይም የኢኮኖሚ ወይም የፖለቲካ ውዴታ የሚያስፈልጉት አካባቢዎች ናቸው፡፡ በዚህ ፕሮግራም የቲንሲያ ዳሌክ አሜሪካን እናስፈልጋለን፡፡ Tunisian Dialect የተጻፈውን የመስመር ትምህርት ጥያቄን ለመፍጠር የመኪን ትምህርት እናጠቃለን፡፡ በመጀመሪያ፣ የSA ስርዓት ፍሬታዎችን በብልሃት የተገኘ አሜስአ እና በብዙ ዳሌካል ዳታዎችን በመጠቀም ሞዴላዎችን እናስተዋልታለን፡፡ We then collect and annotate a Tunisian Dialect corpus of 17.000 comments from Facebook. ይህ ካርፓስ በሌላ አረብኛ አረቢያ ቋንቋዎች ወይም አሜስአ ዳታዎችን ከሚያስተማሩ የተሻለ ምሳሌ ያሳየናል፡፡ ይህም የመጀመሪያ ነፃ የተገኘ ኮርፓስ የቲንስ ሰናትክልት እና የሚመስል ክፍሎች የሚሠራ አስተማሪዎች ዋጋ እንዲሆኑ እናምናለን፡፡Abstract
تختلف اللهجة العربية (DA) اختلافًا كبيرًا عن اللغة العربية التي يتم تدريسها في المدارس والمستخدمة في الاتصال الكتابي والخطاب الرسمي (الأخبار المذاعة ، والدين ، والسياسة ، وما إلى ذلك). هناك العديد من الأبحاث الموجودة في مجال تحليل المشاعر في اللغة العربية (SA). ومع ذلك ، فهي مقصورة بشكل عام على اللغة العربية الفصحى الحديثة (MSA) أو بعض اللهجات ذات الأهمية الاقتصادية أو السياسية. في هذه الورقة ، نحن مهتمون بـ SA لللهجة التونسية. نحن نستخدم تقنيات التعلم الآلي لتحديد قطبية التعليقات المكتوبة باللهجة التونسية. أولاً ، نقوم بتقييم أداء أنظمة SA باستخدام نماذج مدربة باستخدام مجموعات بيانات MSA و Multi-Dialectal المتاحة مجانًا. نقوم بعد ذلك بجمع وتعليق مجموعة اللهجات التونسية المكونة من 17.000 تعليق من Facebook. تتيح لنا هذه المجموعة تحسينًا كبيرًا في الدقة مقارنةً بأفضل نموذج تم تدريبه على اللهجات العربية الأخرى أو بيانات MSA. نعتقد أن هذه المجموعة الأولى المتاحة مجانًا ستكون ذات قيمة للباحثين العاملين في مجال تحليل المشاعر التونسية والمجالات المماثلة.Abstract
Diyaletik …ôr…ôbc…ô dili m…ôkt…ôbl…ôrd…ô √∂yr…ôdilmiŇü …ôr…ôbc…ô dilind…ôn √ßox f…ôrqli v…ô yazńĪlńĪ m√ľzakir…ô v…ô formal s√∂zl…ôrd…ô istifad…ô edilmiŇüdir. Arab dilind…ô Sentiment Analysis (SA) sah…ôsind…ô √ßox m√∂vcuddur araŇütńĪrmalar var. Halbuki onlar genellikle Modern Standard Arabic (MSA) v…ô ya ekonomik v…ô siyasi interesl…ôrin b…ôzi dialektl…ôrin…ô sńĪnńĪr edilirl…ôr. Bu kańüńĪtda biz Tunisya Dialect in in SA'sńĪna maraqlńĪyńĪq. Biz Tunisya Dialektikind…ô yazńĪlmńĪŇü Ňü…ôkill…ôrin polaritńĪnńĪ tanńĪmlamaq √ľ√ß√ľn maŇüńĪn √∂yr…ônm…ô teknikl…ôrini istifad…ô edirik. ńįlk d…ôf…ô, SA sisteml…ôrin performanslarńĪnńĪ √∂zg√ľr m√ľv…ôff…ôqiyy…ôtl…ô MSA v…ô √ßox dialektal veri qurńüularńĪ il…ô t…ôhsil edilmiŇü modell…ôrl…ô t…ôhsil edirik. Sonra Facebookd…ôn 17.000 Ňü…ôhad…ôt ver…ôn Tunisya Dialekt korpusu toplayńĪb bildiririk. Bu korpus biz…ô dig…ôr …ôr…ôb dialektl…ôrind…ô v…ô MSA veril…ônl…ôrind…ô t…ôhsil edil…ôn …ôn …ôn yaxŇüńĪ modeli il…ô m√ľqayis…ôd…ô m√∂hk…ôm bir d√ľz…ôltm…ôy…ô imkan verir. Biz Tunisya Sentiment Analizi v…ô b…ônz…ôr b√∂lgelerinde √ßalńĪŇüan araŇütńĪrmacńĪlara ilk √∂zg√ľr m√ľv…ôff…ôq korpus qiym…ôtli olacańüńĪna inanńĪrńĪq.Abstract
Диалектичният арабски (ДА) се различава значително от арабския език, преподаван в училищата и използван в писмената комуникация и официалната реч (новини, религия, политика и др.). Има много съществуващи изследвания в областта на арабския език Сентимент Анализ (СА); Въпреки това, те обикновено са ограничени до съвременния стандартен арабски (МСА) или някои диалекти от икономически или политически интерес. В тази статия се интересуваме от СА на Тунизийския диалект. Използваме техники за машинно обучение, за да определим полярността на коментарите, написани на тунизийски диалект. Първо, оценяваме ефективността на системите с модели, обучени с помощта на свободно достъпни МСА и Многодиалектални набори от данни. След това събираме и анотираме тунизийски диалект корпус от 17 000 коментара от Фейсбук. Този корпус ни позволява значително подобрение на точността в сравнение с най-добрия модел, обучен на други арабски диалекти или данни от МСА. Вярваме, че този първи свободно достъпен корпус ще бъде ценен за изследователите, работещи в областта на тунизийския анализ на чувствата и подобни области.Abstract
ডায়ালেক্টাল আরবী (ডিএ) স্কুলে শিক্ষা দেওয়া আরবী ভাষা থেকে গুরুত্বপূর্ণ ভিন্ন এবং লিখিত যোগাযোগ এবং আনুষ্ঠানিক ভাষণে ব্যবহৃত (প আরবী ভাষা সেন্টাইমেন্ট বিশ্লেষণের (এসএ) ক্ষেত্রে অনেক বিদ্যমান গবেষণা রয়েছে: তবে তাদের সাধারণত আধুনিক স্ট্যান্ডার্ড আরবী (এমএসএ) অথবা অর্থনৈতিক বা রাজনৈতিক আগ্রহের কিছু ডায়ালিকেলের স এই পত্রিকায় আমরা তিউনিশিয়ার ডায়ালেক্টর এসএ-এ আগ্রহী। We utilize Machine Learning techniques to determine the polarity of comments written in Tunisian Dialect. প্রথমত, আমরা এসএ সিস্টেমের অনুষ্ঠানের মূল্যায়ন করি মোডেল প্রশিক্ষণের মাধ্যমে মুক্তি প্রদান করা হয়েছে মোডেল ব্যবহার করে তারপর আমরা ফেসবুক থেকে ১৭,০০০ মন্তব্যের একটি তিউনিশিয়ান ডায়ালেক্টক কোর্পাস সংগ্রহ করি এবং ঘোষণা করি। এই কোর্পাস আমাদের অন্যান্য আরবী ডায়ালেকশন বা এমএসএ তথ্যের সাথে প্রশিক্ষিত সবচেয়ে ভালো মডেলের তুলনায় গুরুত্বপূর্ আমরা বিশ্বাস করি যে এই প্রথম স্বাধীনতা পাওয়া কোর্পাস তিউনিশিয়ার সেন্টাইমেন্ট বিশ্লেষণ এবং একই রকম এলাকায় কাজ করা গবেষকদের মAbstract
Dialectal Arabic (DA) is significantly different from the Arabic language taught in schools and used in written communication and formal speech (broadcast news, religion, politics, etc.). ཨ་རིའི་སྐད་ཡིག་ནང་དུ་Sentiment Analysis (SA) ལྟ་བ་ཚོའི་གྲལ་ཐིག་ཏུ་གནས་ཡོད་པའི་ལྟ་བ་ཞིབ་མང་པོ་ཡོད། ཡིན་ནའང་། འདི་དག་ནི་དུས་ཀྱི་སྔོན་སྒྲིག་ཨ་རིབ་པི་(MSA)དང་། དཔལ་འབྱོར་ཡང་ན་ཆབ་སྲིད་ཀྱི་ཁྱད་པར་ལ་བཀག་དམ་ཡ འོག་གི་ཤོག་བུ་འདིའི་ནང་དུ་ང་ཚོས་ཊུ་ནེ་ཤི་ཡཱན་སྒྲུང་གི་ས་ཨ་སི་ཡ་ནང་དུ་དགའ་པོ་རེད། ང་ཚོས་ཊུ་ནེ་ཤི་ལེབ་ནང་བྲིས་ཡོད་པའི་མཁན་གྱི་སློབ་རྩིས་ཐབས་ལམ་ལ་བེད་སྤྱོད་དགོས། First, we evaluate the SA system performances with models trained using freely available MSA and Multi-dialectal data sets. འོན་ཀྱང་། ང་ཚོས་ངོ་དེབ་ཐོག་ལས་ཊ་ནེ་ཤི་ཡཱན་སྒོང་གི་མཁས་པ་ཞིག་སྦྲེལ་བ་དང་གསར་དུ་གཏོང་བྱེད། སྤྱི་ཚོགས་ཀྱི་ཞབས་འཛུགས་འདིས་ང་ཚོར་ལ་ཉུང་བའི་རིམ་པ་སྒྲིག་གི་ཐབས་ལམ་གཞན་ཡང་ན་སྐྱོན་བརྗོད་ཚད་ལྡན་དང་། ང་ཚོས་རང་དབང་ཆ་དང་པོ་ཡིན་པའི་སྐོར་དང་རང་དབང་གིས་མཐུན་པའི་མཐུན་འབྲེལ་འདི་ཊུ་ནེ་ཤེས་ཡོད་པའི་དབུལ་ཞིབ་བྱེད་མཁན་གAbstract
Dialektički arapski (DA) značajno je različit od arapskog jezika koji se uči u školama i koristi u pisanoj komunikaciji i formalnoj govoru (novine, religija, politika itd.). Postoji mnogo postojećih istraživanja u oblasti analize sentimenta arapskog jezika (SA); međutim, oni su obično ograničeni na moderni standardni arapski (MSA) ili neki dijalekti ekonomskog ili političkog interesa. U ovom papiru smo zainteresovani za SA Tunisijskog dijalekta. Koristimo tehnike učenja mašine kako bi utvrdili polarnost komentara napisanih u Tunisijskom dijaletu. Prvo procjenjujemo izvedbe sustava SA sa modelima obučenim slobodno dostupnim MSA-om i višedijalektskim podacima. Onda sakupljamo i annotiramo Tunisijski dijalektni korpus sa 17.000 komentara iz Facebook-a. Ovaj korpus nam omogućava značajno poboljšanje preciznosti u usporedbi s najboljim modelom obučenim na drugim arapskim dijalektima ili podacima MSA-a. Vjerujemo da će prvi slobodno dostupni korpus biti vrijedan istraživačima koji rade na terenu Tunisijske analize sentimenta i sličnih područja.Abstract
L'àrab dialectal (DA) és significativament diferent de la llengua àrab ensenyada a les escoles i utilitzada en comunicació escrita i discurs formal (notícies de difusió, religió, política, etc.). Hi ha moltes investigacions existents en el camp de l'anàlisi del sentiment de la llengua àrab; no obstant això, estan generalment restringits a l'àrab Modern Standard (MSA) o a alguns dialectes d'interès econòmic o polític. En aquest article estem interessats en la SA de la Dialecta Tunísia. Utilitzem tècniques d'aprenentatge màquinari per determinar la polaritat dels comentaris escrits a la Diàlecta Tunisiana. Primer, evaluem les performances dels sistemes SA amb models entrenats utilitzant conjunts de dades multidialectals i MSA lliurament disponibles. Llavors recollim i anotem un corpus Tunisian Dialect de 17.000 comentaris de Facebook. Aquest corpus ens permet una millora significativa de la precisió comparada amb el millor model entrenat en altres dialectes àrabs o dades MSA. Creiem que aquest primer cos lliurament disponible serà valiós per als investigadors que treballen en el camp de l'anàlisi del sentiment tunís i àrees similars.Abstract
Dialektální arabština (DA) se výrazně liší od arabštiny vyučované ve školách a používá se v písemné komunikaci a formální řeči (vysílání zpráv, náboženství, politika atd.). Existuje mnoho existujících výzkumů v oblasti analýzy arabského jazyka Sentiment Analysis (SA); Nicméně jsou obecně omezeny na moderní standardní arabštinu (MSA) nebo některé dialekty ekonomického nebo politického zájmu. V tomto článku se zajímáme o SA tuniského dialektu. Používáme techniky strojového učení k určení polarity komentářů napsaných v tuniském dialektu. Nejprve hodnotíme výkonnost SA systémů pomocí modelů trénovaných na základě volně dostupných MSA a multidialektálních datových sad. Poté shromažďujeme a anotujeme korpus tuniského dialektu 17.000 komentářů z Facebooku. Tento korpus nám umožňuje výrazné zlepšení přesnosti ve srovnání s nejlepším modelem trénovaným na jiných arabských dialektech nebo MSA datech. Věříme, že tento první volně dostupný korpus bude cenný pro výzkumníky pracující v oblasti tuniské analýzy sentimentů a podobných oblastí.Abstract
Dialektisk arabisk (DA) adskiller sig betydeligt fra det arabiske sprog, der undervises i skoler og bruges i skriftlig kommunikation og formel tale (udsendelse af nyheder, religion, politik osv.). Der er mange eksisterende undersøgelser inden for arabisk sprog Sentiment Analysis (SA); Men de er generelt begrænset til moderne standard arabisk (MSA) eller nogle dialekter af økonomisk eller politisk interesse. I denne artikel er vi interesseret i SA af Tunesien Dialect. Vi bruger Machine Learning teknikker til at bestemme polariteten af kommentarer skrevet i Tunesisk Dialect. For det første evaluerer vi SA systemernes ydeevne med modeller uddannet ved hjælp af frit tilgængelige MSA- og Multi-dialektiske datasæt. Vi indsamler og kommenterer derefter et tunesisk Dialect korpus på 17.000 kommentarer fra Facebook. Dette korpus giver os en betydelig nøjagtighedsforbedring i forhold til den bedste model, der er uddannet på andre arabiske dialekter eller MSA data. Vi mener, at dette første frit tilgængelige korpus vil være værdifuldt for forskere, der arbejder inden for tunesisk følelsesanalyse og lignende områder.Abstract
Dialektales Arabisch (DA) unterscheidet sich erheblich von der arabischen Sprache, die in Schulen unterrichtet wird und in schriftlicher Kommunikation und formaler Rede (Rundfunknachrichten, Religion, Politik usw.) verwendet wird. Es gibt viele bestehende Forschungen auf dem Gebiet der arabischsprachigen Sentiment Analysis (SA); Sie beschränken sich jedoch im Allgemeinen auf das moderne Standardarabisch (MSA) oder einige Dialekte von wirtschaftlichem oder politischem Interesse. In diesem Beitrag interessieren wir uns für die SA des tunesischen Dialekts. Wir verwenden Machine Learning Techniken, um die Polarität von Kommentaren im tunesischen Dialekt zu bestimmen. Zunächst evaluieren wir die Performance der SA-Systeme mit Modellen, die mit frei verfügbaren MSA- und multidialektalen Datensätzen trainiert wurden. Anschließend sammeln und kommentieren wir ein Tunesisches Dialekt-Korpus von 17.000-Kommentaren von Facebook. Dieses Korpus ermöglicht uns eine signifikante Verbesserung der Genauigkeit im Vergleich zu dem besten Modell, das auf anderen arabischen Dialekten oder MSA-Daten trainiert wurde. Wir glauben, dass dieses erste frei verfügbare Korpus für Forscher, die auf dem Gebiet der tunesischen Stimmungsanalyse und ähnlichen Bereichen arbeiten, wertvoll sein wird.Abstract
Τα διαλεκτικά Αραβικά (DA) διαφέρουν σημαντικά από τα αραβικά που διδάσκονται στα σχολεία και χρησιμοποιούνται στην γραπτή επικοινωνία και στην επίσημη ομιλία (ειδήσεις εκπομπής, θρησκεία, πολιτική κ.λπ.). Υπάρχουν πολλές υπάρχουσες έρευνες στον τομέα της ανάλυσης συναισθημάτων αραβικής γλώσσας (SA). Ωστόσο, γενικά περιορίζονται στα σύγχρονα τυπικά αραβικά (MSA) ή σε ορισμένες διαλέκτες οικονομικού ή πολιτικού ενδιαφέροντος. Στην παρούσα εργασία μας ενδιαφέρει η ΑΕ του Τυνησικού Διαλέκτου. Χρησιμοποιούμε τεχνικές μηχανικής μάθησης για να καθορίσουμε την πολικότητα των σχολίων που γράφονται στην Τυνησική Διαλεκτική. Πρώτον, αξιολογούμε τις επιδόσεις των συστημάτων με μοντέλα εκπαιδευμένα χρησιμοποιώντας ελεύθερα διαθέσιμα σύνολα δεδομένων και πολυδιαλεκτικά. Στη συνέχεια, συλλέγουμε και σχολιάζουμε ένα σώμα από 17.000 σχόλια από το Facebook. Αυτό το σώμα μας επιτρέπει μια σημαντική βελτίωση της ακρίβειας σε σύγκριση με το καλύτερο μοντέλο εκπαιδευμένο σε άλλες αραβικές διαλέκτες ή δεδομένα MSA. Πιστεύουμε ότι αυτό το πρώτο ελεύθερα διαθέσιμο σώμα θα είναι πολύτιμο για τους ερευνητές που εργάζονται στον τομέα της Τυνησικής Ανάλυσης Συναισθημάτων και παρόμοιων τομέων.Abstract
El árabe dialectal (DA) es significativamente diferente del idioma árabe que se enseña en las escuelas y se utiliza en la comunicación escrita y el discurso formal (noticias de difusión, religión, política, etc.). Existen muchas investigaciones existentes en el campo del análisis de sentimientos (SA) del idioma árabe; sin embargo, generalmente se limitan al árabe estándar moderno (MSA) o a algunos dialectos de interés económico o político. En este artículo nos interesa la SA del dialecto tunecino. Utilizamos técnicas de aprendizaje automático para determinar la polaridad de los comentarios escritos en dialecto tunecino. En primer lugar, evaluamos el rendimiento de los sistemas SA con modelos entrenados utilizando conjuntos de datos MSA y multidialectales disponibles gratuitamente. A continuación, recopilamos y comentamos un corpus en dialecto tunecino de 17.000 comentarios de Facebook. Este corpus nos permite una mejora significativa de la precisión en comparación con el mejor modelo entrenado en otros dialectos árabes o datos de MSA. Creemos que este primer corpus disponible gratuitamente será valioso para los investigadores que trabajan en el campo del análisis de sentimientos tunecinos y áreas similares.Abstract
Dialektuaalne araabia keel (DA) erineb oluliselt araabia keelest, mida õpetatakse koolides ja mida kasutatakse kirjalikus suhtluses ja ametlikus kõnes (ringhäälinguuudised, religioon, poliitika jne). Araabia keele Sentiment Analysis (SA) valdkonnas on palju olemasolevaid uuringuid; Siiski on need üldiselt piiratud Modern Standard Araabia (MSA) või mõne majanduslikku või poliitilist huvi pakkuva dialektiga. Selles raamatus oleme huvitatud SA Tuneesia Dialect. Kasutame masinõppe tehnikaid Tuneesia dialektis kirjutatud kommentaaride polaarsuse määramiseks. Esiteks hindame SA süsteemide toimivust mudelitega, mis on koolitatud kasutades vabalt kättesaadavaid MSA ja Multi-dialektuaalseid andmekogumeid. Seejärel kogume ja märgime Tuneesia Dialect korpuse, mis sisaldab 17 000 kommentaari Facebookist. See korpus võimaldab meil märkimisväärselt parandada täpsust võrreldes parima mudeliga, mis on koolitatud teiste araabia murrete või MSA andmetega. Usume, et see esimene vabalt kättesaadav korpus on väärtuslik Tuneesia tunnete analüüsi ja sarnaste valdkondade teadlastele.Abstract
الکتریکی عربی (DA) با زبان عربی که در مدارس آموزش داده شده و در ارتباط نوشته و سخنرانی رسمی استفاده میشود بسیار متفاوت است. تحقیقات زیادی وجود دارد در زمینه تحلیل Sentiment (SA) زبان عربی. با این حال، آنها معمولاً به عربی استاندارد مدرن (MSA) یا بعضی دیالکت های سود اقتصادی یا سیاسی محدود میشوند. در این کاغذ ما علاقهمند به سازمان سازمان سازمان دایلاکت تونیسی هستیم. ما از تکنیک یادگیری ماشین استفاده می کنیم تا تعریف قطعیت توضیحهای نوشته شده در دیالکت تونیسی را تعریف کنیم. اول، ما اجرای سیستمهای SA را با مدلهای آموزش داده شده با استفاده از مجموعه MSA و مجموعههای دادههای متعدد دیالکتی ارزیابی میکنیم. سپس ما یک کورپوس دایلکت تونیسی از ۱۷ هزار توضیح فیس بوک جمع می کنیم و آگاهی می کنیم. این کورپوس به ما اجازه می دهد که بهترین مدل آموزش داده شود در مقایسه با بهترین مدلهای دیالکتهای عربی یا دادههای MSA دقیق بزرگی به ما ارائه دهد. ما معتقدیم که این اولین کورپوس در دسترس آزادی برای تحقیقات کنندگان که در زمینه تحلیل سنتی و منطقههای مشابه تونیس کار میکنند ارزشمند خواهد بود.Abstract
Dialektinen arabia (DA) eroaa merkittävästi koulussa opetetusta arabian kielestä, jota käytetään kirjallisessa viestinnässä ja virallisessa puheessa (uutislähetykset, uskonto, politiikka jne.). Arabian kielen Sentiment Analysis (SA) alalla on olemassa monia tutkimuksia. Kuitenkin ne ovat yleensä rajoitettu Modern Standard Arabic (MSA) tai joitakin taloudellisia tai poliittisia murteita. Tässä artikkelissa olemme kiinnostuneita SA of the Tunisian Dialect. Käytämme koneoppimisen tekniikoita määrittääksemme Tunisian Dialect -kielellä kirjoitettujen kommenttien polariteetin. Ensin arvioimme SA-järjestelmien suorituskykyä malleilla, jotka on koulutettu käyttäen vapaasti saatavilla olevia MSA- ja Multi-dialektisia datakokonaisuuksia. Tämän jälkeen keräämme ja kommentoimme Tunisian Dialect -korpusen, joka sisältää 17 000 kommenttia Facebookista. Tämä korpus mahdollistaa merkittävän tarkkuuden parantamisen verrattuna parhaaseen malliin, joka on koulutettu muista arabianmurteista tai MSA-tiedoista. Uskomme, että tämä ensimmäinen vapaasti saatavilla oleva korpus on arvokas tutkijoille, jotka työskentelevät Tunisian tunteiden analyysin ja vastaavien alojen alalla.Abstract
L'arabe dialectal (DA) est très différent de la langue arabe enseignée dans les écoles et utilisée dans la communication écrite et le discours formel (actualités télévisées, religion, politique, etc.). Il existe de nombreuses recherches dans le domaine de l'analyse du sentiment de la langue arabe (SA) ; cependant, elles sont généralement limitées à l'arabe standard moderne (MSA) ou à certains dialectes d'intérêt économique ou politique. Dans cet article, nous nous intéressons à la SA du dialecte tunisien. Nous utilisons des techniques d'apprentissage automatique pour déterminer la polarité des commentaires écrits en dialecte tunisien. Tout d'abord, nous évaluons les performances des systèmes SA à l'aide de modèles formés à l'aide d'ensembles de données MSA et multi-dialectaux disponibles gratuitement. Nous collectons et annotons ensuite un corpus en dialecte tunisien de 17 000 commentaires provenant de Facebook. Ce corpus nous permet une amélioration significative de la précision par rapport au meilleur modèle formé sur d'autres dialectes arabes ou des données MSA. Nous pensons que ce premier corpus disponible gratuitement sera utile aux chercheurs travaillant dans le domaine de l'analyse du sentiment tunisien et dans des domaines similaires.Abstract
Tá difríocht shuntasach idir an Araibis Chanúnach (DA) agus an teanga Araibis a mhúintear i scoileanna agus a úsáidtear sa chumarsáid scríofa agus sa chaint fhoirmiúil (nuacht craolta, reiligiún, polaitíocht, etc.). Tá go leor taighde ar siúl cheana féin i réimse na hAnailíse Mothúchán sa teanga Araibis (SA); áfach, tá siad teoranta go ginearálta do Araibis Chaighdeánach Nua-Aimseartha (MSA) nó canúintí áirithe a bhfuil spéis eacnamaíoch nó polaitiúil iontu. Sa pháipéar seo tá suim againn i SA Chanúint na Túinéise. Bainimid úsáid as teicnící Machine Learning chun polaraíocht na dtuairimí atá scríofa i Canúint na Túinéise a chinneadh. Ar an gcéad dul síos, déanaimid meastóireacht ar fheidhmíocht na gcóras SA agus múnlaí oilte ag baint úsáide as tacair sonraí MSA agus Ilchanúinteacha atá ar fáil go héasca. Bailímid agus déanaimid anótáil ansin ar chorpas Chanúint na Túinéise de 17,000 trácht ó Facebook. Ligeann an corpas seo feabhas suntasach cruinnis dúinn i gcomparáid leis an tsamhail is fearr atá oilte ar chanúintí Arabacha eile nó ar shonraí MSA. Creidimid go mbeidh an chéad chorpas seo atá ar fáil saor in aisce luachmhar do thaighdeoirí atá ag obair i réimse Anailís Mothúcháin na Túinéise agus réimsí comhchosúla.Abstract
Dialakal (DA) yana mai girma rarrabe daga harshen Larabci wanda aka sanar da shi a cikin littafan littafin da aka yi amfani da cikin littafin koma da magana mai rasmi (broadcast news, religion, political, etc.) Aka da yawa masu ƙidãya a cikin field da aka sanar da fasalin na Larabci (SA). A lokacin da, ko kuma ana ƙunsa su a kan fassarar farko na Larabci (M.A.) ko da wasu kalmõmi masu tsakanin tamkar kasiya da kisa. Ga wannan takardan nan tuna na son SA na Diaki Tunisiya. Tuna amfani da masu Shirin Akwai na Kayan Aiki dõmin mu ƙayyade haske na maganar da aka rubuta a cikin Dialog Tunisi. Kayyan, za'a ƙaddara cikakken na'urar SA da misãlai wanda aka sanar da su da amfani da tsarin mutane da ake samu da masu motsi na masu motsi. Sa'an nan muna sami kuma tuna karatun taƙaita na Tunisiya da 17,000 wa'azi daga Facebook. Wannan makampuni yana yarda mu da kyauta mai girma sami da mafi kyaun misalin wanda aka yi wa wa'anar harshen Larabci ko da data na MAA. We believe that this first freely available corpus will be valuable to researchers working in the field of Tunisian Sentiment Analysis and similar areas.Abstract
הערבית הדיאלקטית (DA) שונה באופן משמעותי מהשפה הערבית ללמדה בבתי הספר ומשתמשת בתקשורת כתובה ונאום רשמי (חדשות לשידור, דת, פוליטיקה, וכו.). יש הרבה מחקרים קיימים בשטח אנליזה הרגשות בשפה הערבית (SA); בכל אופן, הם בדרך כלל מוגבלים לערבית סטנדרטית מודרנית (MSA) או כמה דיאלקטים של עניין כלכלי או פוליטי. בעיתון הזה אנו מעוניינים בס.אס. של דיאלקט טוניסי. אנחנו משתמשים בטכניקות ללמוד מכונות כדי לקבוע את הקוטב של הערות שנכתבו בדיאלקט טוניסי. ראשית, אנו מעריכים את ההופעות של מערכות אס.אס.איי עם דוגמנים מאומנים באמצעות קבוצות נתונים MSA זמינות בחינם ואז אנחנו אוספים ומציינים קורפוס דיאלקט טוניסי של 17,000 תגובות מפייסבוק. הקורפוס הזה מאפשר לנו שיפור מדויק משמעותי בהשוואה למודל הטוב ביותר מאומן על דיאלקטים ערביים אחרים או נתונים MSA. אנו מאמינים שהקורפוס הראשון הזה שיהיה זמין בחינם יהיה ערך למחקרים שעובדים בתחום אנליזה רגשות טוניסית ו אזורים דומים.Abstract
बोलचाल अरबी (डीए) स्कूलों में सिखाई जाने वाली अरबी भाषा से काफी अलग है और लिखित संचार और औपचारिक भाषण (प्रसारण समाचार, धर्म, राजनीति, आदि) में उपयोग की जाती है। अरबी भाषा भावना विश्लेषण (एसए) के क्षेत्र में कई मौजूदा शोध हैं; हालांकि, वे आम तौर पर आधुनिक मानक अरबी (एमएसए) या आर्थिक या राजनीतिक हित की कुछ बोलियों तक सीमित हैं। इस पत्र में हम ट्यूनीशियाई बोली के एसए में रुचि रखते हैं। हम ट्यूनीशियाई बोली में लिखी गई टिप्पणियों की ध्रुवीयता को निर्धारित करने के लिए मशीन लर्निंग तकनीकों का उपयोग करते हैं। सबसे पहले, हम स्वतंत्र रूप से उपलब्ध एमएसए और मल्टी-डायलेक्टल डेटा सेट का उपयोग करके प्रशिक्षित मॉडल के साथ एसए सिस्टम प्रदर्शन का मूल्यांकन करते हैं। फिर हम Facebook से 17.000 टिप्पणियों के ट्यूनीशियाई बोली कॉर्पस को इकट्ठा और एनोटेट करते हैं। यह कॉर्पस हमें अन्य अरबी बोलियों या एमएसए डेटा पर प्रशिक्षित सर्वोत्तम मॉडल की तुलना में एक महत्वपूर्ण सटीकता सुधार की अनुमति देता है। हमारा मानना है कि यह पहला स्वतंत्र रूप से उपलब्ध कॉर्पस ट्यूनीशियाई भावना विश्लेषण और इसी तरह के क्षेत्रों के क्षेत्र में काम करने वाले शोधकर्ताओं के लिए मूल्यवान होगा।Abstract
Dijaletički arapski (DA) značajno je različit od arapskog jezika koji se uči u školama i koristi u pisanoj komunikaciji i formalnoj govoru (vijesti, religija, politika itd.). Postoji mnogo postojećih istraživanja u oblasti arapskog jezika Sentiment Analysis (SA); međutim, oni su obično ograničeni na moderni standardni arapski (MSA) ili neki dijalekti ekonomskog ili političkog interesa. U ovom papiru smo zainteresovani za SA Tunisijskog dijalekta. Koristimo tehnike učenja strojeva kako bi utvrdili polarnost komentara napisanih u Tunisijskom dijaletu. Prvo procjenjujemo izvedbe sustava SA sa modelima obučenim slobodno dostupnim MSA-om i višedijalektskim podacima. Zatim sakupljamo i annotiramo Tunisijski dijalektni korpus sa 17.000 komentara iz Facebook-a. Ovaj korpus nam omogućava značajno poboljšanje preciznosti u usporedbi s najboljim modelom obučenim na drugim arapskim dijalektima ili podacima MSA-a. Vjerujemo da će prvi slobodno dostupni korpus biti vrijedan istraživačima koji rade na području Tunisijske analize sentimenta i sličnih područja.Abstract
A dialektikus arab (DA) jelentősen eltér az iskolákban tanított arab nyelvtől, és az írásbeli kommunikációban és formális beszédben használják (hírek, vallás, politika stb.). Számos már létező kutatás létezik az arab nyelvű Sentiment Analysis (SA) területén; Általában azonban a modern standard arabra (MSA) vagy gazdasági vagy politikai érdekű dialektusokra korlátozódnak. Ebben a tanulmányban érdeklődünk a Tunéziai Dialect SA iránt. Gépi tanulási technikákat alkalmazunk a tunéziai dialektban írt megjegyzések polaritásának meghatározására. Először az SA rendszerek teljesítményét szabadon elérhető MSA és Multi-dialektális adatkészletekkel képzett modellekkel értékeljük. Ezután összegyűjtünk és jegyzetelünk egy 17.000 megjegyzést tartalmazó tunéziai Dialect korpuszt a Facebookról. Ez a korpusz jelentős pontossági javulást tesz lehetővé számunkra a többi arab dialektuson vagy MSA adatokon képzett legjobb modellhez képest. Úgy véljük, hogy ez az első szabadon hozzáférhető korpusz értékes lesz a tunéziai érzelmek elemzésével és hasonló területekkel foglalkozó kutatók számára.Abstract
Դիալեկտալ արաբական (DA) շատ տարբերվում է դպրոցներում սովորեցված արաբական լեզվից, որը օգտագործվում է գրական հաղորդակցման և պաշտոնական խոսքի մեջ (հեռարձակման նորություններ, կրոն, քաղաքականություն, և այլն): Արաբական լեզվի զգացմունքների վերլուծության ոլորտում գոյություն ունի բազմաթիվ հետազոտություններ: սակայն դրանք ընդհանրապես սահմանափակվում են ժամանակակից ստանդարտ արաբական (MSA) կամ տնտեսական կամ քաղաքական հետաքրքրության որոշ դիալեկտների վրա: Այս թղթի մեջ մեզ հետաքրքրում է Թունիսյան դիալեկտի նախագահը: Մենք օգտագործում ենք մեքենային սովորելու մեթոդներ, որպեսզի որոշենք Թունիսյան դիալեկտին գրված մոտեցումների հյուսիսականությունը: Առաջինը, մենք գնահատում ենք ՍԱ-ի համակարգերի արտադրողությունները մոդելների հետ, որոնք սովորեցվել են օգտագործելով անվճար հասանելի MSA և բազմադիալեկտալ տվյալների համակարգեր: Այնուհետև մենք հավաքում և annoտում ենք Թունիսյան դիալեկտի կորպուսը, որն ունի 17,000 մեկնաբանություն Ֆեյսբուքից: This corpus allows us a significant accuracy improvement compared to the best model trained on other Arabic dialects or MSA data. Մենք հավատում ենք, որ առաջին անվճար հասանելի մարմինը արժեքավոր կլինի Թունիսյան զգացմունքների վերլուծության ոլորտում աշխատող հետազոտողների և նման ոլորտների համար:Abstract
Arab dialektal (DA) berbeda dengan bahasa Arab yang diajarkan di sekolah dan digunakan dalam komunikasi tulis dan pidato formal (berita siaran, agama, politik, dll.). Ada banyak penelitian yang ada dalam bidang Analisi Sentiment Bahasa Arab (SA); namun, mereka secara umum dibatasi dengan Arab Standard Modern (MSA) atau beberapa dialekt kepentingan ekonomi atau politik. Dalam kertas ini kami tertarik pada SA dari Dialeks Tunisia. We utilize Machine Learning techniques to determine the polarity of comments written in Tunisian Dialect. Pertama, kami mengevaluasi prestasi sistem SA dengan model yang dilatih menggunakan set data MSA dan Multi-dialektal yang tersedia secara bebas. Kemudian kita mengumpulkan dan anotasi sebuah korpus Dialek Tunisia dari 17.000 komentar dari Facebook. Korpus ini memungkinkan kita memperbaiki akurasi yang signifikan dibandingkan dengan model terbaik yang dilatih pada dialekt Arab lain atau data MSA. Kami percaya bahwa korpus pertama yang tersedia secara bebas ini akan berharga bagi para peneliti yang bekerja di bidang Analisi Sentimen Tunisia dan daerah yang sama.Abstract
L'arabo dialettale (DA) è significativamente diverso dalla lingua araba insegnata nelle scuole e utilizzata nella comunicazione scritta e nel discorso formale (notizie di trasmissione, religione, politica, ecc.). Ci sono molte ricerche esistenti nel campo dell'analisi dei sentimenti in lingua araba (SA); Tuttavia, sono generalmente limitati all'arabo standard moderno (MSA) o ad alcuni dialetti di interesse economico o politico. In questo articolo siamo interessati alla SA del Dialect tunisino. Utilizziamo tecniche di Machine Learning per determinare la polarità dei commenti scritti in Dialect tunisino. In primo luogo, valutiamo le prestazioni dei sistemi SA con modelli formati utilizzando set di dati MSA e Multi-dialettali liberamente disponibili. Raccogliamo e annotiamo un corpus Dialect tunisino di 17.000 commenti da Facebook. Questo corpus ci permette un significativo miglioramento della precisione rispetto al miglior modello addestrato su altri dialetti arabi o dati MSA. Crediamo che questo primo corpus liberamente disponibile sarà prezioso per i ricercatori che lavorano nel campo dell'analisi tunisina dei sentimenti e aree simili.Abstract
方言アラビア語( DA )は、学校で教えられ、書面によるコミュニケーションや正式なスピーチ(放送ニュース、宗教、政治など)で使用されるアラビア語とは大きく異なります。 アラビア語センチメント分析( SA )の分野には多くの既存の研究がありますが、一般的には現代標準アラビア語( MSA )または経済的または政治的に関心のあるいくつかの方言に限定されています。 本稿では、チュニジア方言のSAについて興味を示します。 機械学習技術を活用して、チュニジア方言で書かれたコメントの極性を判断しています。 まず、無料で利用可能なMSAおよび多方言データセットを使用してトレーニングされたモデルを使用して、SAシステムのパフォーマンスを評価します。 その後、Facebookから17,000件のコメントのチュニジア方言コーパスを収集し、注釈を付けます。 このコーパスは、他のアラビア語の方言やMSAデータでトレーニングされた最高のモデルと比較して、大幅な精度向上を可能にします。 この最初の自由に利用可能なコーパスは、チュニジアのセンチメント分析および同様の分野で働く研究者にとって貴重なものになると考えています。Abstract
dialewat arap (Da) sing mengko ajeng-ajeng karo langgambar arap sing gurutuhan ning sekolah lan gampang penyandhuné karo kesempatan (basa dhéwé, Dino, politik, njl.) Kaya akèh akeh penggungan saiki nang kelompok kanggo langgambar arap Sentiment Test (S). Nanging, wong-wong kuwi ngregani dipoleh kanggo ngerasakno ning basa sing nyebutaké ning basa sing dumadhi iki ning karakno sing diradirangke ingkang dipoleksi. Nanging mapun iki, awak dhéwé seneng ngrembug-seneng nggo klebu disebarke Tunis. Awak dhéwé nggambar Pak Learning teknik nggawe Kemerdekaan polarity Komentar anyar kang Tunisian diaelect. Awak dhéwé, ngêluwih éntuk sistem S" sing berarti perusahaan model sing ditambah akeh basa gambar SMA karo data Multi-dialectal. Awak dhéwé ngékoké lan nganggo cara-cara Diyelecto kuwi tanggal pulu, iki dadi, limangasu sekang pulu kanggo kowé tambah bantêr. Gosoko iki supoyo awak dhéwé sing beraksi kanggo dianggap meraké awak dhéwé karo model sing luwih apik dhéwé, sing nyebutuhake dhéwé dialecto arab karo data MTA. Awak dhéwé ngpisan bener iki banget kabèh perusahaan kenal dhéwé iso nggawe kamulyan perusahaan winih ning acara SentimentAbstract
დიალექტალური აპაბიური (DA) უფრო განსხვავებულია აპაბიური ენაზე, რომელიც სკოლაში მოსწავლია და გამოყენებულია წერილი კომუნიკაციაში და ფორმალური ენაში (გაგზავ არაბული ენის სენტიმენტი ანალიზაციის (SA) პანელში მნიშვნელოვანი იყოს. მაგრამ, ისინი განსაკუთრებულია მოდინარე სტანდარტანეტ არაბული (MSA) ან ეკონომიკური ან პოლიტიკური ინტერესტის დიალეკტები. ამ დოგომაში ჩვენ ინტერესებულია ტუნისური დიალექტის SA-ში. ჩვენ გამოვიყენებთ მაქინის სწავლების ტექნოგიები, რომელიც ტუნისური დიალექტში წერტილი კომენტრების პოლარიტი. პირველად, ჩვენ SA სისტემის გამოყენება მოდელებით, რომლებიც მოსწავლია თავისუფალურად ხელმისაწყებული MSA და მრავალეთალექტური მონაცემები. შემდეგ ჩვენ ტვისუბუკის 17.000 კომენტრების ტუნისური დიალექტის კორპუსს შევყენებთ და ამოტვირთებთ. ეს კოპპუსი გვაქვს ძალიან მნიშვნელოვანი წარმოდგენება, როგორც სხვა აპაბური დიალვკტებზე ან MSA მონაცემებზე უკეთესი მოდელთან შემდეგ. ჩვენ ვფიქრობთ, რომ ეს პირველი თავისუფალურად ხელხილი კორპუს იქნება უფრო სანიშვნელოვანი იქნება მსწავლობელი, რომლებიც მუშაობენ ტუნისური სენტიმენAbstract
Диалектикалық Араб (ДА) мектептерде оқыту араб тілінен әртүрлі, жазылған коммуникациялық және официалдық сөйлемелерде қолданылады (жаңалықтар, дінінің, саясаттары, т.б Араб тілінің Sentiment Analysis (SA) өрісінде көп зерттеулері бар. Бірақ олар кәдімгі қазіргі Араб стандартты (MSA) немесе экономикалық не саяси қызықтың диалекттеріне шектелген. Бұл қағазда біз Тунис диалекті SA-ға қызықтық. Тунис диалектінде жазылған түсініктердің поляриялығын анықтау үшін машина оқыту техникаларын қолданамыз. Біріншіден, біз SA жүйелерінің жұмыс істерін артық MSA және көп диалектикалық деректер жиындарын қолдану үлгілерімен оқу үлгілерін бағалаймыз. Содан кейін біз Тунис диалект корпусын Фейсбуктан 17.000 түсініктемелерді жинап жазып жатырмыз. Бұл корпус бізге басқа араб диалекттерінде не MSA деректеріне салыстырылған ең жақсы үлгілеріне салыстырып, дұрыс жақсартуға мүмкіндік береді. Біз бірінші қол жеткізетін корпус Тунис Sentiment Analysis және ұқсас аумақтарында жұмыс істейтін зерттеушілер үшін маңызды болады деп ойлаймыз.Abstract
아랍어 사투리(DA)는 학교에서 가르치는 아랍어와 크게 달라 서면 교류와 공식 강연(방송뉴스, 종교, 정치 등)에 쓰인다.아랍어 감정 분석(SA) 분야는 이미 많은 연구가 있었다.그러나 이들은 통상적으로 현대 표준 아랍어(MSA)나 경제적 또는 정치적 이익을 가진 사투리에 한정된다.본문에서 우리는 튀니지 사투리의 SA에 대해 흥미를 느낀다.우리는 기계 학습 기술을 이용하여 튀니지 사투리 평론의 극성을 확정한다.우선, 우리는 무료 MSA와 다방언 데이터 집합 트레이닝 모델을 사용하여 SA시스템의 성능을 평가한다.그리고 페이스북에서 17000개의 논평을 포함하는 튀니지 사투리 자료 라이브러리를 수집해 주석했다.이 어료 라이브러리는 다른 아랍어 사투리나 MSA 데이터에서 훈련하는 가장 좋은 모델에 비해 정확성을 현저히 높일 수 있다.우리는 이 무료로 제공되는 어료 라이브러리가 튀니지 정서 분석과 유사한 분야의 연구자들에게 가치가 있을 것이라고 믿는다.Abstract
Dialektinė arabų kalba (DA) labai skiriasi nuo mokyklose mokomos arabų kalbos, naudojamos rašytiniame komunikacijoje ir oficialioje kalboje (transliuojamos naujienos, religija, politika ir t. t.). Yra daug esamų mokslinių tyrimų arabų kalbos jautrumo analizės (SA) srityje; tačiau jos paprastai taikomos tik šiuolaikinei standartinei arabų kalbai (MSA) arba kai kuriems ekonominio ar politinio intereso dialektams. Šiame dokumente mus domina Tuniso dialekto SA. Mes naudojame mašininio mokymosi metodus, kad nustatytume Tuniso dialekte parašytų komentarų poliarumą. Pirma, vertiname SA sistemų rezultatus naudojant modelius, parengtus naudojant laisvai prieinamus MSA ir daugiadialektalinius duomenų rinkinius. Tuomet surenkame ir anotuojame Tuniso dialekto korpusą, kuriame yra 17 000 komentarų iš Facebook. Šis korpusas leidžia mums gerokai pagerinti tikslumą, palyginti su geriausiu modeliu, parengtu kitais arabų dialektais arba MSA duomenimis. Manome, kad šis pirmasis laisvai prieinamas korpusas bus vertingas Tuniso jautrumo analizės ir panašių sričių mokslininkams.Abstract
Дијалектален арапски (ДК) е значително различен од арапскиот јазик кој се учи во училиштата и кој се користи во писмената комуникација и формалниот говор (вести за емитување, религија, политика итн.). Постојат многу постојни истражувања во областа на Арапскиот јазик Анализа на чувствата (СА); сепак, тие генерално се ограничени на модерниот стандарден арапски (МСА) или некои дијалекти од економски или политички интерес. Во овој весник сме заинтересирани за СА на тунискиот дијалект. Користиме техники на машинско учење за да ја одредиме поларитетата на коментарите напишани во тунискиот дијалект. Прво, ги проценуваме резултатите на системите на СА со модели обучени користејќи слободно достапни компјутери на MSA и мултидијалектални податоци. Потоа собираме и анотираме туниски дијалект корпус со 17.000 коментари од Фејсбук. Овој корпус ни овозможува значително подобрување на точноста во споредба со најдобриот модел обучен на други арапски дијалекти или MSA податоци. Веруваме дека овој прв слободно достапен корпус ќе биде вреден за истражувачите кои работат во областа на туниската анализа на чувствата и слични области.Abstract
ഡയലക്ട്രല് അറബി (DA) സ്കൂളുകളില് പഠിപ്പിക്കപ്പെട്ട അറബിഭാഷയില് നിന്നും വളരെ വ്യത്യസ്തമാണ്. എഴുതിയ വാക്കുകളും ഫോളില് വാക്കു അറബി ഭാഷയിലെ സെന്റിമെന്റ് അനാലസിയുടെ പ്രദേശത്ത് നിലവിലുള്ള അനേക ഗവേഷണങ്ങളുണ്ട്. however, they are generally restricted to Modern Standard Arabic (MSA) or some dialects of economic or political interest. ഈ പത്രത്തില് നമുക്ക് തുണിഷ്യന് ഡയലക്ട്രിക്കിന്റെ എസ്എസില് താല്പര്യമുണ്ട്. ഞങ്ങള് മെഷീന് പഠിപ്പിക്കുന്ന സാങ്കേതികവിദ്യകള് ഉപയോഗിക്കുന്നു തുണിസിയന് ഡയലക്ട്രെക്റ്റില് എഴുതിയി ആദ്യം, ഞങ്ങള് എസ് സിസ്റ്റം പ്രവര്ത്തനങ്ങളെ പരിശീലിപ്പിക്കുന്നത് സ്വാതന്ത്ര്യം ലഭ്യമായ എസ്എം ഉപയോഗിച്ച് മോഡലു പിന്നീട് ഞങ്ങള് ഒരു ടൂണിഷ്യന് ഡയലക്റ്റ് കോര്പ്പുസിനെ കൂട്ടിച്ചേര്ക്കുകയും ചെയ്യുന്നു. ഫേസ്ക്കൂളി ഈ കോര്പ്പുസ് നമുക്ക് മറ്റു അറബിക്ക് വിവരങ്ങളില് പഠിപ്പിക്കപ്പെട്ട ഏറ്റവും ഗുരുതരമായ ഒരു മെഡില് മെച്ചപ്പെടുത് ഞങ്ങള് വിശ്വസിക്കുന്നു, ഇത് ആദ്യം സ്വതന്ത്ര്യമായി ലഭിക്കുന്ന കോര്പ്പുസ് തുണിസിയന് സെന്റിമെന്റ് അനാലസിസിന്റെയAbstract
Диалект Араб (ДНБ) сургуульд сургуульд сурсан Араб хэл, бичсэн харилцаа, үндсэн ярианд хэрэглэгддэг (мэдээ, шашин, улс төрийн, т.д.). Араб хэлний Sentiment Analysis (SA) салбарт олон судлаачид байна. Гэхдээ эдийн засгийн, улс төрийн сонирхолтой хэлбэрээр орчин үеийн Араб стандарт (MSA) эсвэл зарим хэлбэрээр хязгаарлагддаг. Энэ цаасан дээр бид Тунисийн Диалектийн ДАБ-д сонирхолтой. Бид Тунисийн Диалект дээр бичигдсэн сэтгэл зүйлсийг тогтоохын тулд Машин суралцах техникуудыг ашиглаж байна. Эхлээд бид SA системийн үйл ажиллагааг үнэгүй MSA болон олон диалектикийн өгөгдлийн сангуудыг ашиглаж сургалтын загваруудыг үнэлдэг. Тэгээд бид Тунисийн Диалект Корпус Фейсбуктаас 17.000 илтгэл тайлбар цуглуулж, анзаарах болно. Энэ корпус бидэнд бусад Араб диалект эсвэл MSA өгөгдлийн хамгийн сайн загвартай харьцуулахад тодорхой нарийвчлалтай сайхан сайхан хөгжүүлэх боломжтой болгодог. Бид түүний анхны эрх чөлөөтэй болох корпус нь Тунисийн сэтгэл санааны анализ болон төстэй хэсэгт ажилладаг судлаачид үнэ цэнэтэй болно гэж итгэдэг.Abstract
Bahasa Arab dialektal (DA) berbeza secara signifikan dari bahasa Arab yang diajar di sekolah dan digunakan dalam komunikasi tulis dan ucapan rasmi (berita siaran, agama, politik, dll.). There are many existing researches in the field of Arabic language Sentiment Analysis (SA); bagaimanapun, mereka secara umum diharamkan kepada Arab Standard Modern (MSA) atau beberapa dialekt kepentingan ekonomi atau politik. Dalam kertas ini kami tertarik pada SA dari Dialek Tunisia. Kami menggunakan teknik pembelajaran Mesin untuk menentukan polariti komentar yang ditulis dalam Dialeks Tunisia. Pertama, kita menilai prestasi sistem SA dengan model dilatih menggunakan set data MSA dan Multi-dialektal yang tersedia secara bebas. Kemudian kita mengumpulkan dan anotasi satu korpus Tunisian Dialect dengan 17.000 komen dari Facebook. Korpus ini membolehkan kita memperbaiki ketepatan yang signifikan dibandingkan dengan model terbaik dilatih pada dialekt Arab lain atau data MSA. Kami percaya bahawa korpus pertama yang tersedia secara bebas akan berharga bagi penyelidik yang bekerja dalam bidang Analisi Sentimen Tunisia dan kawasan yang serupa.Abstract
Dialectal Arabic (DA) is significantly different from the Arabic language taught in schools and used in written communication and formal speech (broadcast news, religion, politics, etc.). Hemm ħafna riċerki eżistenti fil-qasam tal-Analiżi tas-Sentiment tal-lingwa Għarbija (SA); madankollu, huma ġeneralment ristretti għall-Għarab Standard Modern (MSA) jew għal xi dijaletti ta’ interess ekonomiku jew politiku. F’dan id-dokument aħna interessati fl-SA tad-Dijaletta Tuneżina. Aħna nużaw tekniki ta’ Tagħlim bil-Magni biex niddeterminaw il-polarità tal-kummenti miktuba fid-Dijaletta Tuneżina. L-ewwel nett, jivvalutaw il-prestazzjonijiet tas-sistemi SA b’mudelli mħarrġa bl-użu ta’ settijiet ta’ dejta MSA u multidijalektali disponibbli b’mod ħieles. Imbagħad niġbru u niannotaw korpus tad-Djalett Tuneżin ta’ 17,000 kumment minn Facebook. Dan il-korpus jippermettilna titjib sinifikanti fil-preċiżjoni meta mqabbel mal-a ħjar mudell imħarreġ fuq dijaletti Għarab oħra jew dejta MSA. Aħna nemmnu li dan l-ewwel korpus disponibbli b’mod ħieles se jkun ta’ valur għar-riċerkaturi li jaħdmu fil-qasam tal-Analiżi tas-Sentimenti Tuneżina u oqsma simili.Abstract
Dialectaal Arabisch (DA) verschilt aanzienlijk van de Arabische taal die op scholen wordt onderwezen en wordt gebruikt in geschreven communicatie en formele spraak (uitzendingen, religie, politiek, enz.). Er zijn veel bestaande onderzoeken op het gebied van Arabische taal Sentiment Analysis (SA); Ze zijn echter over het algemeen beperkt tot Modern Standaard Arabisch (MSA) of sommige dialecten van economisch of politiek belang. In dit artikel zijn we geïnteresseerd in de SA van het Tunesische Dialect. We maken gebruik van Machine Learning technieken om de polariteit van commentaren geschreven in Tunesische Dialect te bepalen. Eerst evalueren we de prestaties van SA-systemen met modellen die getraind zijn met vrij beschikbare MSA en multidialectische datasets. Vervolgens verzamelen en annoteren we een Tunesisch Dialect corpus van 17.000 reacties van Facebook. Dit corpus maakt een aanzienlijke verbetering van de nauwkeurigheid mogelijk ten opzichte van het beste model getraind op andere Arabische dialecten of MSA-gegevens. Wij geloven dat dit eerste vrij beschikbare corpus waardevol zal zijn voor onderzoekers die werkzaam zijn op het gebied van Tunesische Sentiment Analysis en soortgelijke gebieden.Abstract
Dialektisk arabisk (DA) er betydelig forskjellig frå arabisk språk lært i skolar og brukt i skrivne kommunikasjon og formelt tale (informasjon, religium, politikk osv.). Det finst mange eksisterande forskningar i feltet Sentiment Analysis (SA) i arabisk språk. Men dei er generelt begrenset til moderne standardsarabiske (MSA) eller nokre dialektar med økonomiske eller politiske interesse. I denne papiret er vi interessert i SA av Tunisisk dialekt. Vi bruker maskinelæringsteknikk for å bestemme polariteten på kommentarar skrevene i Tunisisk dialekt. Først evaluerer vi SA-systemutviklingane med modeller trengte med fritt tilgjengelege MSA og fleire dialektiske datasett. Vi samler og annoterar tunisisk dialektkorpus med 17 000 kommentarar frå Facebook. Denne korpusen tillèt oss ein signifikant nøyaktig forbedring i sammenligning med den beste modellen som trengte på andre arabiske dialektar eller MSA-data. Vi tror at denne første tilgjengelege korpusen vil være verdileg for forskere som arbeider i feltet Tunisianske sentimentanalyser og liknande område.Abstract
Dialektalny arabski (DA) różni się znacząco od języka arabskiego uczonego w szkołach i stosowany w komunikacji pisemnej i formalnej (wiadomości transmisyjne, religia, polityka itp.). Istnieje wiele istniejących badań w zakresie analizy sentymentów języka arabskiego (SA); Są one jednak zazwyczaj ograniczone do współczesnego standardowego arabskiego (MSA) lub niektórych dialektów będących przedmiotem zainteresowania gospodarczego lub politycznego. W niniejszym artykule interesuje nas SA Dialektu Tunezyjskiego. Wykorzystujemy techniki Machine Learning do określenia polaryzacji komentarzy napisanych w dialektie tunezyjskim. W pierwszej kolejności oceniamy wydajność systemów SA za pomocą modeli przeszkolonych przy użyciu wolno dostępnych zbiorów danych MSA i Multi-dialektalnych. Następnie zbieramy i adnotację tunezyjskiego dialektu z 17.000 komentarzy z Facebooka. Korpus ten pozwala nam znacznie poprawić dokładność w porównaniu z najlepszym modelem trenowanym na innych dialektach arabskich lub danych MSA. Wierzymy, że ten pierwszy swobodnie dostępny korpus będzie cenny dla naukowców pracujących w dziedzinie tunezyjskiej analizy sentymentów i podobnych obszarów.Abstract
O árabe dialetal (DA) é significativamente diferente da língua árabe ensinada nas escolas e usada na comunicação escrita e no discurso formal (notícias transmitidas, religião, política, etc.). Existem muitas pesquisas existentes no campo da Análise de Sentimentos (SA) da língua árabe; no entanto, eles são geralmente restritos ao árabe moderno padrão (MSA) ou alguns dialetos de interesse econômico ou político. Neste artigo estamos interessados na SA do dialeto tunisiano. Utilizamos técnicas de aprendizado de máquina para determinar a polaridade dos comentários escritos em dialeto tunisiano. Primeiro, avaliamos o desempenho dos sistemas SA com modelos treinados usando conjuntos de dados MSA e multidialetais disponíveis gratuitamente. Em seguida, coletamos e anotamos um corpus de dialeto tunisiano de 17.000 comentários do Facebook. Este corpus nos permite uma melhoria significativa da precisão em comparação com o melhor modelo treinado em outros dialetos árabes ou dados MSA. Acreditamos que este primeiro corpus disponível gratuitamente será valioso para pesquisadores que trabalham na área de Análise de Sentimentos da Tunísia e áreas afins.Abstract
Araba dialectală (DA) este semnificativ diferită de limba arabă predată în școli și folosită în comunicarea scrisă și discursul formal (știri difuzate, religie, politică etc.). Există multe cercetări existente în domeniul analizei sentimentelor în limba arabă (SA); Cu toate acestea, ele sunt, în general, limitate la arabă standard modernă (MSA) sau la unele dialecte de interes economic sau politic. În această lucrare suntem interesați de SA a Dialectului Tunisian. Utilizăm tehnici de Machine Learning pentru a determina polaritatea comentariilor scrise în Dialect tunisian. În primul rând, evaluăm performanțele sistemelor SA cu modele instruite folosind seturi de date MSA și Multi-dialectale disponibile gratuit. Apoi colectăm și adnotam un corpus Dialect tunisian de 17.000 de comentarii de pe Facebook. Acest corpus ne permite o îmbunătățire semnificativă a acurateții comparativ cu cel mai bun model instruit pe alte dialecte arabe sau date MSA. Considerăm că acest prim corp liber disponibil va fi valoros pentru cercetătorii care lucrează în domeniul analizei sentimentelor tunisiane și domenii similare.Abstract
Диалектный арабский язык значительно отличается от арабского языка, преподаваемого в школах и используемого в письменном общении и официальной речи (новости радиовещания, религия, политика и т.д.). Существует множество исследований в области анализа настроений (SA) на арабском языке; однако они, как правило, ограничиваются современным стандартным арабским языком (MSA) или некоторыми диалектами, представляющими экономический или политический интерес. В этой статье мы заинтересованы в SA тунисского диалекта. Мы используем методы машинного обучения для определения полярности комментариев, написанных на тунисском диалекте. Во-первых, мы оцениваем производительность систем SA с помощью моделей, обученных с использованием свободно доступных наборов данных MSA и Multi-dialectal. Затем мы собираем и аннотируем тунисский диалектный корпус из 17 000 комментариев от Facebook. Этот корпус позволяет нам значительно повысить точность по сравнению с лучшей моделью, обученной на других арабских диалектах или данных MSA. Мы считаем, что этот первый свободно доступный корпус будет ценным для исследователей, работающих в области анализа тунисских настроений и аналогичных областях.Abstract
ඩායිලෙක්ටල් අරාබිකාව (DA) විශේෂයෙන් අරාබි භාෂාව ඉගෙන ගත්තා ස්කූලේස් වලින් වෙනස් වෙනුවෙන් ලියපු සම්බන් අරාබි භාෂාවේ සංවේදනය විශ්ලේෂණය (SA) ගැන හැමදායක් තියෙනවා; නමුත්, ඔවුන් සාමාන්යයෙන්ම ස්ථානය අරාබිකාව (MSA) නැත්තම් අර්ථාත්මක නැත්තම් රාජ්යාත්මක සහ ර මේ පත්තරේ අපිට ටුනිසියාන් ඩායිලෙක්ට් එකේ SA එක ගැන ප්රශ්නයක් තියෙනවා. අපි ටුනිසියාන් ඩායිලෙක්ට් වල ලියලා තියෙන ප්රශ්නයක් තීරණය කරන්න මැෂින් ඉගෙන ඉගෙනීම් තාක්ෂණය ප මුලින්ම, අපි SA පද්ධතියේ ප්රශ්නයක් විශ්වාස කරන්නේ නිදහස් ප්රශ්නයක් තියෙන්නේ MSA සහ Multi-Dialectal දත්ත සැටිම ඊට පස්සේ අපි ටුනිසියාන් ඩායිලෙක්ට් කොර්පුස් එක්ක සම්බන්ධ කරනවා ඒ වගේම ෆේස්බුක් වලින් 17.000 කිය මේ කෝර්පුස් අපිට විශේෂ සැකසුම් විශේෂ වැඩ කරන්න පුළුවන් වෙනවා අනිත් අරාබික් ඩායිලක්ට් නැත්තම් MSA අපි විශ්වාස කරනවා මේ පලවෙනි නිදහස් විශ්වාස කරන්න පුළුවන් කොර්පුස් විශ්වාස කරනවා ටුනිසියාන් සංවේදනය විAbstract
Dialektna arabska (DA) se bistveno razlikuje od arabskega jezika, ki se poučuje v šolah in se uporablja v pisni komunikaciji in formalnem govoru (oddajanje novic, vera, politika itd.). Obstaja veliko obstoječih raziskav na področju arabskega jezika analize sentimenta (SA); Vendar pa so na splošno omejeni na Modern Standard Arabic (MSA) ali nekatera narečja gospodarskega ali političnega interesa. V tem članku nas zanima SA Tunizijskega dialekta. Uporabljamo tehnike strojnega učenja za določitev polarnosti komentarjev, napisanih v tunizijskem dialektu. Najprej smo ocenili delovanje sistemov SA z modeli, usposobljenimi z uporabo prosto dostopnih MSA in Multi-dialektualnih podatkovnih nizov. Nato zbiramo in označujemo korpus Tunizijskega Dialeta s 17.000 komentarji s strani Facebooka. Ta korpus nam omogoča znatno izboljšanje natančnosti v primerjavi z najboljšim modelom, usposobljenim za druge arabske narečja ali MSA podatke. Verjamemo, da bo ta prvi prosto dostopni korpus dragocen za raziskovalce, ki delajo na področju tunizijske analize čustev in podobnih področij.Abstract
Dialectal Carabi (DA) waa mid aad u kala duwan yahay iskuulka afka Carabiga lagu baray iyo waxaa lagu isticmaalaa warqad qoraal ah iyo hadal rasmi ah (warbixinta, diinta, siyaasada, etc.) Baaritaanka fasaxa ee afka Carabiga (SA) waxaa ku yaal baaritaano badan oo jira. Si kastaba ha ahaatee waxay u xadgudbaan qaramada asalka caadiga ah ee Carabiga (MSA) ama qaramada dhaqaalaha ama danaha siyaasada ah. Warqadan waxaynu ka xiisaynaynaa SA ee ku qoran qoraalka Tunisiya. Waxaynu isticmaalnaa qalabka waxbarashada machine si aan u caddeyno baaritaanka kommentaha ee ku qoran Dialect Tunisian. Marka ugu horeysa, waxaynu qiimeynaynaa bandhigyada nidaamka SA oo samooyin lagu tababaray si xor ah u isticmaalaya samooyin macluumaad badan oo la isticmaali karo. Markaas waxaynu ka soo ururinnaa oo baaraandegaa qoraalka Tunisiya oo ka mid ah 17,000 comment. Kanu wuxuu inaga dhigi karaa horumarin cadaan ah oo la baro tusaale ahaan ugu wanaagsan oo lagu baray luuqadaha kale ee Carabiga ama macluumaadka MSA. Waxaynu aaminsanahay in koopustan ugu horraysa xor la’aan ah ay qiimaan tahay kuwa ka shaqeeya beerta baaritaanka iyo qaybaha la mid ah ee magaalada Tunisiya.Abstract
Arabisht dialektal (DA) është ndryshe në mënyrë të konsiderueshme nga gjuha arabe e mësuar në shkolla dhe e përdorur në komunikimin e shkruar dhe fjalimin zyrtar (lajmet e transmetimit, feja, politika, etj.). Ka shumë kërkime ekzistuese në fushën e Analizës së Sentimenteve në gjuhën arabe (SA); megjithatë, ato janë përgjithësisht të kufizuara në Arabisht Modern Standard (MSA) apo disa dialekte të interesit ekonomik apo politik. Në këtë letër ne jemi të interesuar në SA të Dialektit Tunizian. Ne përdorim teknikat e mësimit të makinave për të përcaktuar polaritetin e komenteve të shkruara në Dialektin Tunizian. First, we evaluate the SA systems performances with models trained using freely available MSA and Multi-dialectal data sets. Pastaj mbledhim dhe anotojmë një korpus të Dialektit Tunizian me 17.000 komente nga Facebook. Ky korpus na lejon një përmirësim të rëndësishëm saktësi krahasuar me modelin më të mirë të trajnuar në dialekte të tjera arabe apo të dhëna MSA. Ne besojmë se ky korpus i parë i lirë në dispozicion do të jetë i vlefshëm për kërkuesit që punojnë në fushën e Analizës së Sentimenteve Tuniziane dhe fusha të ngjashme.Abstract
Dijaletički arapski (DA) značajno je različit od arapskog jezika koji se uči u školama i koristi u pisanoj komunikaciji i formalnoj govoru (vesti, religija, politika itd.). Postoji mnogo postojećih istraživanja na oblasti analize sentimenta arapskog jezika (SA); međutim, oni su općenito ograničeni na moderni standardni arapski (MSA) ili neki dijalekti ekonomskog ili političkog interesa. U ovom papiru smo zainteresovani za SA Tunisijskog dijalekta. Koristimo tehnike učenja mašine kako bi utvrdili polarnost komentara napisanih u Tunisijskom dijaletu. Prvo procjenjujemo izvedbe sistema SA sa modelima obučenim slobodno dostupnim MSA-om i višedijalektnim setima podataka. Onda sakupljamo i annotiramo Tunisijski dijalektni korpus sa 17.000 komentara na Facebook-u. Ovaj korpus nam omogućava značajno poboljšanje tačnosti u usporedbi sa najboljim modelom obučenim na drugim arapskim dijalektima ili podacima MSA-a. Vjerujemo da će prvi slobodno dostupni korpus biti vrijedan istraživačima koji rade na oblasti Tunisijske analize sentimenta i sličnih područja.Abstract
Dialektal Arabic (DA) skiljer sig avsevärt från det arabiska språket som lärs ut i skolor och används i skriftlig kommunikation och formellt tal (sändningar av nyheter, religion, politik, etc.). Det finns många befintliga forskning inom området arabiska språk Sentiment Analysis (SA); Men de är generellt begränsade till moderna standardarabiska (MSA) eller vissa dialekter av ekonomiskt eller politiskt intresse. I denna uppsats är vi intresserade av SA för Tunisien Dialect. Vi använder maskininlärningstekniker för att fastställa polariteten i kommentarer skrivna i Tunisisk Dialect. Först utvärderar vi SA-systemens prestanda med modeller utbildade med fritt tillgängliga MSA- och multidialektiska datauppsättningar. Vi samlar sedan in och kommenterar en tunisisk Dialect-korpus med 17 000 kommentarer från Facebook. Denna korpus ger oss en betydande noggrannhet förbättring jämfört med den bästa modellen utbildad på andra arabiska dialekter eller MSA-data. Vi tror att denna första fritt tillgängliga korpus kommer att vara värdefull för forskare som arbetar inom området Tunisisk Sentiment Analysis och liknande områden.Abstract
Kiarabu cha Kiingereza (DA) ni tofauti sana na lugha ya Kiarabu inayofundishwa shule na inatumika kwa mawasiliano na hotuba rasmi (habari za matangazo, dini, siasa, etc.). Kuna tafiti nyingi zilizopo katika uwanja wa uchambuzi wa Seneti ya Kiarabu (SA); Hata hivyo, kwa ujumla wanazuiwa na Kiarabu cha Modern Standard (MSA) au baadhi ya miungu ya maslahi ya kiuchumi au kisiasa. Katika karatasi hii tunavutiwa na Afrika Kusini ya Mjadala wa Tunisia. Tunatumia mbinu za kujifunza mashine ili kuamua uchaguzi wa maoni yaliyoandikwa katika Dialect ya Tunisia. Kwanza, tunatathmini matukio ya mfumo wa Afrika Kusini na mifano inayofundishwa kwa kutumia seti za data zilizopatikana huru za MSA na taratibu nyingi za kidijitali. We then collect and annotate a Tunisian Dialect corpus of 17.000 comments from Facebook. Kampuni hii inaruhusu kuboreshwa kwa ufanisi mkubwa ukilinganishwa na mtindo bora uliojifundishwa kwa lugha nyingine za Kiarabu au data za MSA. Tunaamini kuwa chombo hiki cha kwanza kinachopatikana kwa uhuru utakuwa na thamani kwa watafiti wanaofanya kazi katika uwanja wa uchambuzi wa Seneti wa Tunisia na maeneo yanayofanana.Abstract
Dialectal Arabic (DA) பள்ளிகளில் கற்றுக் கொடுக்கப்பட்டுள்ள அரபி மொழியிலிருந்து மிக்க மாறுபட்டது மற்றும் எழுத்து தொடர்பு மற்றும் வடிவமான பே அரபி மொழி உணர்வு புலத்தில் பல உள்ள ஆய்வுகள் உள்ளன (SA) ஆனால், அவர்கள் பொதுவாக பாதுகாப்பு நிலையான அரபி அல்லது பொருளாதார அரசியல் தேவையின் சில விளக்கங்களை வரையறுக்கப்பட இந்த காகிதத்தில் நாம் துன்சியன் டையலெக்டின் SA விரும்புகிறோம். நாம் இயந்திரம் கற்றல் தொழில்நுட்பத்தை பயன்படுத்தி எழுதப்பட்ட குறிப்புரைகளின் தீவிரத்தை தீர்மானிக்கவும். முதலில், நாம் SA அமைப்புகள் செயல்பாடுகளை மதிப்பிடுகிறோம் மாதிரிகள் பயிற்சி செய்யப்பட்ட முறைமைகளை பயன்படுத்துகிறத பின்னர் நாம் ஒரு துன்சியன் டையல் கார்ப்ஸ் சேகரிக்க மற்றும் அறிவிக்க வேண்டும். This corpus allows us a significant accuracy improvement compared to the best model trained on other Arabic dialects or MSA data. நாங்கள் நம்புகிறோம் இந்த முதல் இலவசமாக கார்புஸ் துன்சியன் உணர்வு புலத்தில் வேலை செய்யும் ஆராய்ச்சியாளர்Abstract
Dialektik Arabça (DA) mekdeplerde öwrenmeýän arapça dilinden örän üýtgeşik we formal çykyşda ulanýar. Sentiment Analyzy (SA) sahypalarda birnäçe bar bar arap dilinde. Ýöne olar dünýä görnüşde Modern Standardan Arapça (MSA) ýa-da ekonomik ýa syýasy gyzyklanýan dialektlere söndürilýärler. Bu kagyzda biz Tuniziýan Dijaletiň SA bilen gyzyklanýarys. Tünsiýan Dialektynda ýazylan suratlaryň polaritesini bejermek üçin Maşynyň öwrenmek tekniklerini ullanýarys. Ilkinji gezek, MSA we Multi-dialektal maglumat düzümlerini üýtgetmeli modeller bilen SA sistemleriniň eserlerini çykarýarys. Sonra Facebookdan 17.000 terjime eden Tunisiýanyň Dialect korpusyny ýygnaýarys we duýýarys. Bu korpus bize başga arap dialektlerde we MSA maglumatynda görä has dogry düzeltmegi mümkin edýär. Biz bu ilkinji özgür önümde bar korpusyň Tuniziýa Sentiment Analyzasy we meňzeş bölgelerde işleýän araştyrmalar üçin deň bolar diýip pikir edýäris.Abstract
الکتریکی عربی زبان (DA) اسکولوں میں سکھایا گیا ہے اور لکھی باتوں اور رسمی باتوں میں استعمال کیا گیا ہے۔ عربی زبان میں بہت سی موجود تحقیقات (SA) ہیں۔ لیکن ان کو معمولاً مدرن استاندارڈ عربی (MSA) یا اقتصادی یا سیاسی علاقے کے کچھ ڈالکتے محدود ہوتے ہیں۔ اس کاغذ میں ہم کو تونیس ڈیلٹ کی SA کی علاقه مند ہیں۔ ہم نے ٹونیسی ڈائیلٹ میں لکھے ہوئے ٹونیسی ٹونیسی ڈائیلٹ میں لکھے ہوئے ٹونیسی ٹونیسی ٹونیسی سیکھنے کی تکنیک استعمال کرتے ہیں۔ پہلے، ہم نے SA سیستموں کی مطالعہ مطالعہ کی مطالعہ مطالعہ کی موڈل کے ذریعہ مطالعہ کیا ہے، مطالعہ کے ذریعہ مطالعہ کے مطالعہ سے مطالعہ کیا گیا ہے. پھر ہم ایک ٹونیسی ڈائیلٹ کورپوس کو فیس بوک سے 17.000 ٹونیسی ٹونیسی ڈائیلٹ کورپوس جمع کرتے ہیں۔ یہ کورپوس ہمیں ایک بڑی دقیق ترقیق کا اضافہ دیتا ہے اور اس کے مطابق دوسرے عربی دیالکت یا MSA ڈیٹے پر آموزش کی بہترین مدل کے مطابق۔ ہم نے سمجھ رکھا ہے کہ یہ پہلی آزاد کارپوس ٹونیسی سنٹیمنٹ تحلیل اور اس جیسی منطقه میں کام کرنے والوں کے لئے ارزش پائیں گے۔Abstract
Dialectal arab maktablarda o'rganish maktablardan juda ajoyib turgan va yozuvlar va rasm tilda ishlatiladi. Арабча синент таҳлилишининг майдонида кўп таҳлиллар мавжуд; Lekin ular umuman Modern Standard Arabi (MSA) yoki economic yoki politik qiziqaruvchiga bir necha dialeklarga qaraydi. Bu hujjatda biz Tunisiya Dialekkasi SA haqida qiziqaramiz. Biz Tunisiya Dialectda yozilgan izohlarning polarini aniqlash uchun mashina o'rganish teknologidan foydalanamiz. Birinchisi, biz ASA tizimi bajarishlarini qiymatimiz mumkin, imkoniyatli MSA va Multi dialekal maʼlumot moslamalari bilan ishlatilgan modellar bilan o'rganamiz. Keyin biz Facebook bilan 17,000 izohlarni birlashtiramiz va tadbirlashmiz. Bu korpus bizga boshqa arab dialeklarga yoki MSA maʼlumotlarida o'rganilgan eng yaxshi modelga o'rganish imkoniyatini beradi. Biz ishonamiz, bu birinchi xolos mavjud korpus Tunisiya Sentiment Analysis va bir xil sohalarda ishlayotgan qiymatga ega bo'ladi.Abstract
"Văn học Ả rập" có sự khác biệt rất lớn so với ngôn ngữ tiếng Ả Rập được dạy trong trường học và được dùng trong liên lạc và ngôn ngữ chính thức (tin tức phát sóng, tôn giáo, chính trị, v.v). Có rất nhiều nghiên cứu có tồn tại trong lĩnh vực phân tích ngôn ngữ Ả rập. Tuy nhiên, thông thường họ chỉ có ngôn ngữ Trung Quốc (MSA) hay một số phương ngữ của kinh tế hay chính trị. Chúng tôi có hứng thú với văn bản này. Chúng tôi sử dụng kỹ thuật giáo dục máy móc để xác định độ cực của các bình luận được viết trong Hộp thoại Tunisia. Trước tiên, chúng tôi đánh giá khả năng của hệ thống SA với những mô hình được đào tạo nhờ vào nó và hệ thống dữ liệu đa phương. Chúng tôi thu thập và ghi âm thanh thanh thanh thanh của một cầu thủ Điện thoại Tunisia ghi chú từ Facebook. Tập thể này cho phép chúng ta cải thiện độ chính xác đáng kể so với mô hình tốt nhất được rèn luyện trên các phương ngữ Á Rập hay dữ liệu MSA. Chúng tôi tin rằng cái cơ thể đầu tiên có được tự do này sẽ có giá trị cho các nhà nghiên cứu làm việc trong lĩnh vực phân tích cảm xúc của Tunisia và những khu vực tương tự.Abstract
方言阿拉伯语(DA)与学校教授之阿拉伯语异,施于书流、正演(播新闻、宗教、政治等)。 阿拉伯语情析(SA)域多见。 然常止于今准阿拉伯语(MSA)或有济利之言。 本文中,感突尼斯方言之SA。 吾以机器学术定突尼斯方言之极性。 先用免费之 MSA ,多方之数,以质 SA 统之性。 然后收Facebook注17.000条论者突尼斯方言料库。 比诸阿拉伯语方言及 MSA 数训练之最,此语料库使我得显准确性。 吾信首免费之语料库于突尼斯情析域类者,将有直也。- Anthology ID:
- W17-1307
- Volume:
- Proceedings of the Third Arabic Natural Language Processing Workshop
- Month:
- April
- Year:
- 2017
- Address:
- Valencia, Spain
- Venues:
- WANLP | WS
- SIG:
- SEMITIC
- Publisher:
- Association for Computational Linguistics
- Note:
- Pages:
- 55–61
- Language:
- URL:
- https://aclanthology.org/W17-1307
- DOI:
- 10.18653/v1/W17-1307
- Bibkey:
- Cite (ACL):
- Salima Medhaffar, Fethi Bougares, Yannick Estève, and Lamia Hadrich-Belguith. 2017. Sentiment Analysis of Tunisian Dialects : Linguistic Ressources and ExperimentsTunisian Dialects: Linguistic Ressources and Experiments. In Proceedings of the Third Arabic Natural Language Processing Workshop, pages 55–61, Valencia, Spain. Association for Computational Linguistics.
- Cite (Informal):
- Sentiment Analysis of Tunisian Dialects : Linguistic Ressources and ExperimentsTunisian Dialects: Linguistic Ressources and Experiments (Medhaffar et al., 2017)
- Copy Citation:
- PDF:
- https://aclanthology.org/W17-1307.pdf
- Code
- fbougares/TSAC
- Data
- TSAC, LABR
- Terminologies:
Export citation
@inproceedings{medhaffar-etal-2017-sentiment, title = "Sentiment Analysis of Tunisian Dialects : Linguistic Ressources and Experiments{T}unisian Dialects: Linguistic Ressources and Experiments", author = "Medhaffar, Salima and Bougares, Fethi and Est{\`e}ve, Yannick and Hadrich-Belguith, Lamia", booktitle = "Proceedings of the Third {A}rabic Natural Language Processing Workshop", month = apr, year = "2017", address = "Valencia, Spain", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/W17-1307", doi = "10.18653/v1/W17-1307", pages = "55--61", }
<?xml version="1.0" encoding="UTF-8"?> <modsCollection xmlns="http://www.loc.gov/mods/v3"> <mods ID="medhaffar-etal-2017-sentiment"> <titleInfo> <title>Sentiment Analysis of Tunisian Dialects : Linguistic Ressources and ExperimentsTunisian Dialects: Linguistic Ressources and Experiments</title> </titleInfo> <name type="personal"> <namePart type="given">Salima</namePart> <namePart type="family">Medhaffar</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Fethi</namePart> <namePart type="family">Bougares</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Yannick</namePart> <namePart type="family">Estève</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Lamia</namePart> <namePart type="family">Hadrich-Belguith</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <originInfo> <dateIssued>2017-04</dateIssued> </originInfo> <typeOfResource>text</typeOfResource> <relatedItem type="host"> <titleInfo> <title>Proceedings of the Third Arabic Natural Language Processing Workshop</title> </titleInfo> <originInfo> <publisher>Association for Computational Linguistics</publisher> <place> <placeTerm type="text">Valencia, Spain</placeTerm> </place> </originInfo> <genre authority="marcgt">conference publication</genre> </relatedItem> <identifier type="citekey">medhaffar-etal-2017-sentiment</identifier> <identifier type="doi">10.18653/v1/W17-1307</identifier> <location> <url>https://aclanthology.org/W17-1307</url> </location> <part> <date>2017-04</date> <extent unit="page"> <start>55</start> <end>61</end> </extent> </part> </mods> </modsCollection>
%0 Conference Proceedings %T Sentiment Analysis of Tunisian Dialects : Linguistic Ressources and ExperimentsTunisian Dialects: Linguistic Ressources and Experiments %A Medhaffar, Salima %A Bougares, Fethi %A Estève, Yannick %A Hadrich-Belguith, Lamia %S Proceedings of the Third Arabic Natural Language Processing Workshop %D 2017 %8 April %I Association for Computational Linguistics %C Valencia, Spain %F medhaffar-etal-2017-sentiment %R 10.18653/v1/W17-1307 %U https://aclanthology.org/W17-1307 %U https://doi.org/10.18653/v1/W17-1307 %P 55-61
Markdown (Informal)
[Sentiment Analysis of Tunisian Dialects : Linguistic Ressources and ExperimentsTunisian Dialects: Linguistic Ressources and Experiments](https://aclanthology.org/W17-1307) (Medhaffar et al., 2017)
- Sentiment Analysis of Tunisian Dialects : Linguistic Ressources and ExperimentsTunisian Dialects: Linguistic Ressources and Experiments (Medhaffar et al., 2017)
ACL
- Salima Medhaffar, Fethi Bougares, Yannick Estève, and Lamia Hadrich-Belguith. 2017. Sentiment Analysis of Tunisian Dialects : Linguistic Ressources and ExperimentsTunisian Dialects: Linguistic Ressources and Experiments. In Proceedings of the Third Arabic Natural Language Processing Workshop, pages 55–61, Valencia, Spain. Association for Computational Linguistics.