CONAN-COunter NArratives through Nichesourcing : a Multilingual Dataset of Responses to Fight Online Hate SpeechCONAN - COunter NArratives through Nichesourcing: a Multilingual Dataset of Responses to Fight Online Hate Speech CONAN - Verhouer NArratives deur Nichesourcing: ֳ¢ֲ€ֲ™n Multilingual Dataset van Antwoorde na Geveg Online ֳ«le Hat Spraak CONAN - CONAN - COUNTER NArratives via Nichesource: a Multilingual Dataset of Responses to Fight Online Hate Speech CONAN - COunter NArratives من خلال مصادر مختلفة: مجموعة بيانات متعددة اللغات للردود على محاربة خطاب الكراهية على الإنترنت CONAN - Nichesourcing vasitəsilə NArratives COunter: online nefret sözlərini döyüşdürmək üçün çoxlu dil verilən verilənlər Конан - Контер Наративи чрез Никесорсинг: многоезичен набор от данни от отговори за борба с онлайн речта на омразата কনান - নিক্সোর্সিং এর মাধ্যমে ন্যারেটিভিসের সাথে যোগাযোগ করুন: অনলাইন ঘৃণা ভাষণের বিরুদ্ধে লড়াই করার জন্য একটি বহুভা CONAN - COunter NArratives through Nichesourcing: a Multilingual Dataset of Responses to Fight Online Hate Speech CONAN - NARATIVA NARATIVA kroz Nichesourcing: multijezički datum odgovora na borbu protiv online govora mržnje CONAN - COunter NArratives a través de Nichesourcing: un conjunt de dades multilingües de respostes a la lluita contra l'odi en línia Vícejazyčný datový soubor reakcí na boj proti nenávistné řeči online CONAN - COunter NArratives gennem Nichesourcing: et flersproget datasæt af svar til bekæmpelse af online hadefuldtale CONAN.COunter NArratives through Nichesourcing: ein mehrsprachiger Datensatz von Reaktionen zur Bekämpfung von Online-Hassreden Ένα πολύγλωσσο σύνολο δεδομένων για την καταπολέμηση της διαδικτυακής ρητορικής μίσους CONAN - Conter Narratives through Nichesourcing: un conjunto de datos multilingüe de respuestas para combatir el discurso de odio en línea CONAN - COunter NArratives through Nichesoursing: a mitmekeelne andmekogum vastustest võitlemiseks online vihakõne CONAN - NArratives COunter through Nichesourcing: a Multilingual Data of Responses to Fight Online Hate Speech CONAN - COunter NArratives through Nichesourcing: a Multilingual Data of Responses to Fight Online Hate Speech CONAN - Counter Narratives through Nichesourcing : un ensemble de données multilingue de réponses pour lutter contre le discours de haine en ligne CONAN - Frithscéalta trí NichesFoinsiú: Tacar Sonraí Ilteangach Freagraí chun Cainte Fuath Ar Líne a Chomhrac CONAN - COunter NArrative through Nichesource: a set of data set of Resons to Combat Online Hate Spelling CONAN - COunter NArratives through Nichesourcing: a Multilingual Dataset of Responses to Fight Online Hate Speech CONAN - Nichesourcing के माध्यम से COunter NArratives: ऑनलाइन हेट स्पीच से लड़ने के लिए प्रतिक्रियाओं का एक बहुभाषी डेटासेट CONAN - NARATIVA NARATIVA kroz Nichesourcing: multijezički datum odgovora na borbu protiv online govora mržnje CONAN - COunter NArratives through Nichesourcing: a válaszok többnyelvű adatkészlete az online gyűlöletbeszéd leküzdésére ԿՈՆԱն - Կոբենր Նարատիվ լավագույների միջոցով: Անցանց ատելության խոսքի պատասխանների բազմալեզու տվյալներ CONAN - COunter NARATIVE melalui Nichesourcing: sebuah Dataset Multilingual of Responses to Fight Online Hate Speech CONAN - COunter NArratives through Nichesourcing: un dataset multilingue di risposte per combattere l'odio online コナン-ニッチソーシングによる共同編集NArratives :オンラインヘイトスピーチとの戦いへの対応の多言語データセット (COMANN - COMunter NaRRATS throng NIKEssourceng: a Multilanguage Datease of responses to combat online hase Talk CONAN - ნარატიგები Nichesourcing- ის გამოყენება: მრავალენგური მონაცემების მონაცემების ბაზა CONAN - Nichesourcing арқылы NArratives - онлайн жетістік сөйлесу үшін көптілік деректер бағдарламасы 코난 - Nichesourcing을 통해 반 서사: 다중 언어의 응답 데이터 집합으로 온라인 증오 언론에 대항하는 데 사용 CONAN - COunter NArratives through Nichesourcing: a Multilingual Dataset of Responses to Fight Online Hate Speech CONAN - COunter NArratives through Nichesourcing: a Multilingual Dataset of Responses to Fight Online Hate Speech CONAN - നിക്ഷോര്സിന്റെ വഴിയിലൂടെ നാററേറ്റിവുകള് കണ്ടുമുട്ടുക: ഓണ്ലൈന് വെറുപ്പ് സംസാരിക്കാന് ഒരു മണ്ടില് ഭാഷ CONAN - Никесоурцингийн аргаар НАРАТИВТ: онлайн үзэн ядах ярианы хариултын олон хэлний өгөгдлийн сан CONAN - COunter NArratives melalui Nichesourcing: satu Set Data Berbahasa Balasan untuk melawan Ucapan Kebencian Online CONAN - COunter NArratives through Nichesourcing: a Multilingual Dataset of Responses to Fight Online Hate Speech CONAN.COunter NArratives door nichesourcing: een meertalige dataset van reacties om online haatspraak te bestrijden CONAN – COunter NArratives gjennom Nichesourcing: ein fleirspråk databasert av svar til å kjempe på nettverkshatspråk CONAN.COunter NArratives through Nichesourcing: wielojęzyczny zestaw danych odpowiedzi na walkę z mową nienawiści online CONAN - Contra-narrativas por meio de Nichesourcing: um conjunto de dados multilíngue de respostas para combater o discurso de ódio online CONAN - COunter NArratives through Nichesourcing: un set de date multilingv de răspunsuri pentru combaterea discursului online de ură CONAN - COunter NArratives through Nichesourcing: a Multilingual Dataset of Responses to Fight Online Hate Speech CONAN - කෝන්ටර් නැරැටිවල් නිකෝසෝර්සින්ස් එක්ක: ගොඩක් භාෂාත්මක දත්ත සැකසුම් සටන් කරන්න අන්ලායින් විරෝ CONAN - COunter NARRATIVE skozi nišesourcing: večjezični nabor podatkov o odzivih na boj proti sovražnemu govoru na spletu CONAN - COunter NArratives via Nichesource: a Multilingual Dataset of Responses to Fight Online Hate Speech CONAN - COunter NArratives nëpërmjet Nichesourcing: një dataset shumëgjuhësh të përgjigjeve për të luftuar fjalimin e urrejtjes në internet CONAN - NARATIVE NARATIVE kroz Nichesourcing: multijezički datum odgovora na borbu protiv online govora mržnje CONAN - COunter NArratives through Nichesourcing: en flerspråkig dataset med svar för att bekämpa hattal online CONAN - Kubaliana na wataalamu kupitia Nichesource: Seti ya data ya lugha nyingi ya majibu ya kupambana na Hotuba ya Hati ya Mtandaoni CONAN - நிக்ஸோர்சிங் மூலம் நெருங்கும் விவரங்கள்: இணைய வெறுப்பு பேச்சை போர் போராடுவதற்கு பல மொழி தகவல் அமைப்புகள் CONAN - Nichesourcing aracılığıyla COunter NArratives: a Multilingual Dataset of Responses to Fight Online Hate Speech CONAN - ناکراتیوں کے ذریعے ناکراتیوں کو ناکراتیوں کے ذریعے کنٹر کریں: ایک بہت سی زبان ڈاتیسٹ اولاین ناراضی بات لڑنے کے لئے جواب دینے کے لئے CONAN - Koò£rib chiqish uchun bir nechta lugò£lik maò¥lumot satri Đạo luật chưa đạt được thông qua Hẹn hò: một dữ liệu đa ngôn ngữ về phản ứng chống đối trực tuyến. CONAN - 因利基外包:击在线仇言者多言应数集
Yi-Ling Chung, Elizaveta Kuzmenko, Serra Sinem Tekiroglu, Marco Guerini
Abstract
Although there is an unprecedented effort to provide adequate responses in terms of laws and policies to hate content on social media platforms, dealing with hatred online is still a tough problem. Tackling hate speech in the standard way of content deletion or user suspension may be charged with censorship and overblocking. One alternate strategy, that has received little attention so far by the research community, is to actually oppose hate content with counter-narratives (i.e. informed textual responses). In this paper, we describe the creation of the first large-scale, multilingual, expert-based dataset of hate-speech / counter-narrative pairs. This dataset has been built with the effort of more than 100 operators from three different NGOs that applied their training and expertise to the task. Together with the collected data we also provide additional annotations about expert demographics, hate and response type, and data augmentation through translation and paraphrasing. Finally, we provide initial experiments to assess the quality of our data.Abstract
Alhoewel daar 'n onvoorspoedige versoek is om adequate antwoordes te verskaf ingevolge wette en beleid om inhoud te haat op sosiale media platforme, is nog 'n moeilike probleem met haat online. Hoor spraak in die standaard manier van inhoud uitvee of gebruiker suspensie kan besluit word met censorskap en oorblokking. Een alternatiewe strategie wat tot ver aandag deur die ondersoek gemeenskap ontvang het, is om eintlik haat inhoud te teenstel met anti-narraties (bv. inligte tekstuurlike antwoordes). In hierdie papier beskrywe ons die skepping van die eerste groot skaal, multitaal, ekspertiseerde datastel van haat-spreek/teen-narratiewe paar. Hierdie datastel is gebou met die versoek van meer as 100 operators van drie verskillende NVO wat hul onderwerp en ekspertisering op die taak aanwend het. En saam met die versamele data, verskaf ons ook addisionele notasies oor eksperte demografie, haat en antwoord tipe en data vergroot deur vertaling en parafrasing. Eindelik, ons verskaf inisiale eksperimente om die kwaliteit van ons data te evalueer.Abstract
ምንም እንኳን፣ የህግ እና ፖለቲካዎች በማኅበራዊ ሚዲያ መድረክ ላይ ጥላቻን የሚጠሉትን ጥላቻን በመጠቀም ላይ የሚበቃቸውን መልስ ማድረግ ምንም እንኳ ሳይሆን ተግባር አለበት፡፡ የጥል ንግግር በጥላቻ ማሰናከል ወይም ተጠቃሚው ማሰናከል እና ማሰናከል በመደረጃ ማሰናከል ይችላል፡፡ ምርመራ ማኅበረሰብ የጥቂት ትኩረት የተቀበለ አንድ ተቃውሞ የጥል ትርጓሜ በተቃውሞ ተቃውሞ ነው፡፡ በዚህ ካላት፣ የመጀመሪያውን ትልቁ ደረጃዎች፣ የብዙ ቋንቋዎች፣ የጥል-ንግግር/ተቃዋሚ ዓይነቶች የዳታተኝነትን መፍጠር እናሳውቃለን፡፡ ይህ የዳታ setup ለስራው ማህበረሰብ እና ባለምህርት የሚያደርጉት ከሦስት ልዩ አካባቢዎች የሚበልጡ 100 የሚጨምሩ ባለሥልጣናት ተሠርቷል፡፡ በተሰበሰቡት ዳታዎችን በተጨማሪው የዴሞግራፊዎች፣ ጥል እና መልስ ዓይነት እና በማተርጓም እና በተፈላጊ እና በማድረግ ላይ የሚጨምሩትን ማስታወቂያ እናደርጋለን፡፡ በመጨረሻም የዳራዎችን ብዛት ለማስተዋል የመጀመሪያ ፈተናዎች እናደርጋለን፡፡Abstract
على الرغم من وجود جهد غير مسبوق لتقديم ردود مناسبة من حيث القوانين والسياسات لكراهية المحتوى على منصات وسائل التواصل الاجتماعي ، إلا أن التعامل مع الكراهية عبر الإنترنت لا يزال يمثل مشكلة صعبة. قد يتم فرض الرقابة والإفراط في الحظر على معالجة خطاب الكراهية بالطريقة القياسية لحذف المحتوى أو تعليق المستخدم. إحدى الإستراتيجيات البديلة ، التي لم تحظ باهتمام كبير حتى الآن من قبل مجتمع البحث ، هي معارضة محتوى الكراهية بروايات مضادة (أي الردود النصية المستنيرة). في هذه الورقة ، نصف إنشاء أول مجموعة بيانات واسعة النطاق ومتعددة اللغات وقائمة على الخبراء من أزواج خطاب الكراهية / السرد المضاد. تم إنشاء مجموعة البيانات هذه بجهود أكثر من 100 مشغل من ثلاث منظمات غير حكومية مختلفة طبقت تدريبها وخبراتها على المهمة. جنبًا إلى جنب مع البيانات التي تم جمعها ، نقدم أيضًا تعليقات توضيحية إضافية حول التركيبة السكانية الخبيرة ، ونوع الكراهية والاستجابة ، وزيادة البيانات من خلال الترجمة وإعادة الصياغة. أخيرًا ، نقدم تجارب أولية لتقييم جودة بياناتنا.Abstract
Əgər sosyal media platformlarında məlumatı nifrət etmək üçün qanunların və siyasətlərin müqabilində uyğun cavab vermək üçün, onlardan nifrət etmək is ə hələ də çətin bir problemdir. Məzmun silinməsi və istifadəçilərin istifadə etməsi standart yolunda nifrət sözlərini çəkmək censorsiya və çox bloklama ilə yüklənməsi mümkün olar. Araştırma cəmiyyəti tərəfindən çox az dikkati alınan alternatif bir strateji, əlbəttə, counter-narrativlar ilə nifrət məlumatlarına qarşı çıxmaq. Bu kağızda, ilk böyük, çoxlu dil, ekspertlər tabanlı veri qurmasını təsdiq edirik. Bu verilən qurğu işə təhsil və təhsil göstərən üç müxtəlif NVO-dan 100-dən fazla operatörlərin çabaları ilə inşa edildi. Birlikte toplanmış verilər ilə birlikdə ekspertlər demografik, nifrət və cavab türü və məlumat artırması ilə birlikdə xəbərdar edirik. Sonunda, məlumatlarımızın keyfiyyətini değerləşdirmək üçün ilk eksperimenti təmin edirik.Abstract
Въпреки че има безпрецедентни усилия за осигуряване на адекватни отговори по отношение на законите и политиките за омраза на съдържанието в социалните медии, справянето с омразата онлайн все още е труден проблем. Справянето с речта на омразата по стандартния начин на изтриване на съдържание или спиране на потребителя може да бъде обвинено в цензура и свръхблокиране. Една алтернативна стратегия, която досега е получила малко внимание от изследователската общност, е всъщност да се противопостави на съдържанието на омразата с контраразкази (т.е. информирани текстови отговори). В тази статия описваме създаването на първия мащабен многоезичен експертен набор от данни от двойки реч на омразата/контра-разказ. Този набор от данни е изграден с усилията на повече от 100 оператора от три различни неправителствени организации, които приложиха своето обучение и експертен опит към задачата. Заедно с събраните данни предоставяме и допълнителни анотации за експертна демография, тип омраза и отговор, както и увеличаване на данните чрез превод и парафразиране. И накрая, ние предоставяме първоначални експерименти за оценка на качеството на нашите данни.Abstract
যদিও সামাজিক মিডিয়ার প্লাটফর্মে বিষয়বস্তুকে ঘৃণা করার জন্য আইন এবং নীতির মাধ্যমে যথেষ্ট প্রতিক্রিয়া প্রদানের জন্য অগ্রগতির প্রচেষ্টা বিষয়বস্তুকে মুছে ফেলা অথবা ব্যবহারকারী সেন্সরশিপের বিরুদ্ধে ঘৃণা বাক্যের বিরুদ্ধে অভিযুক্ত হতে পারে। এক বিকল্প কৌশল, যা গবেষণা সম্প্রদায়ের দ্বারা অল্প মনোযোগ পেয়েছে তা আসলে ঘৃণা বিষয়বস্তুর বিরুদ্ধে (যেমন তথ্য প্রকাশিত টেক্সুয়াল প In this paper, we describe the creation of the first large-scale, multilingual, expert-based dataset of hate-speech/counter-narrative pairs. এই ডাটাসেট তিনটি বিভিন্ন এনজিও থেকে ১০০ জনের বেশী অপারেটরের প্রচেষ্টার সাথে নির্মাণ করা হয়েছে যারা তাদের প্রশিক্ষণ সংগ্রহের তথ্যের সাথে আমরা বিশেষজ্ঞ গণগ্রাফিক, ঘৃণা এবং প্রতিক্রিয়া ধরনের সম্পর্কে আরো বিশেষজ্ঞ প্রদান করি এবং অনুবাদ এবং প্যারা অবশেষে, আমরা প্রাথমিক পরীক্ষা দিচ্ছি আমাদের তথ্যের মান মূল্যায়নের জন্য।Abstract
སྤྱི་ཚོགས་འབྲེལ་མཐུད་དྲ་རྒྱའི་ནང་དུ་ཡོད་པའི་དཀའ་ངལ་གཅིག་གམ། ནང་དོན་བསུབ་ནུས་པ་དང་ལག་ལེན་པའི་བསམ་བློ་གཏོང་གི་སྔོན་སྒྲིག་འགོད་ཀྱི་ཐབས་ལམ་ལ་བཀག འཚོལ་ཞིབ་ཀྱི་ཐབས་ལམ་གཞན་ཞིག་ཡིན་པས་འཚོལ་ཞིབ་ཀྱི་ཚོགས་སྡེའི་ནང་དུ་ཚོར་བ་སྐྱེན་འདོར་བ་དང་། འུ་ཅག་གིས་ཤོག་བྱང་འདིའི་ནང་དུ་ཚོའི་སྐྱེས་ཆེན་དང་སྐད་རིགས་ཆེ་བའི་གསར་བསྐྲུན་དང་། སྒྲིག་ཆ་འཕྲིན་ཡིག་ཆ་འདི་ལ་ལས་སྒུལ་སྤྱོད་མཁན་ལས་༡༠༠་ཙམ་གྱི་སྒུལ་ཤུགས་ཀྱིས་བྲིས་བ་རེད། མཉམ་དུ་བསྡོམས་པའི་ཆ་འཕྲིན་གྱི་ནང་དུ་ང་ཚོས་སྐྱོན་ཅན་གྱི་སྤྱོད་ཕྱོགས་སྣང་ཚོར་བ་མང་ཙམ་སྟོན་བྱེད་ཀྱི་ཡོད། མཐའ་མར་ང་ཚོས་འགོ་འཛུགས་པའི་བརྟག་ཞིབ་བྱས་ནས་ང་ཚོའི་གནས་ཚུལ་གསལ་བཤད་བྱེད་རྒྱུ་དེ་རེད།Abstract
Iako postoji neprecedentni napor za pružanje odgovarajućih odgovora u smislu zakona i politike za mržnju sadržaja na platformama društvenih medija, rješavanje mržnje na internetu je i dalje težak problem. Uzimanje govora mržnje na standardan način obrisanja sadržaja ili suspenzije korisnika može biti optuženo za cenzuru i prekoračenje. Jedna druga strategija, koja je do sada dobila malo pažnje od strane istraživačke zajednice, je da se zapravo suprotstavlja sadržaja mržnje protiv priče (tj. informativne tekstualne odgovore). U ovom papiru opisujemo stvaranje prvih velikih, multijezičkih, stručnih podataka o razgovoru mržnje/protivnih parova. Ova kompleta podataka je izgrađena naporima više od 100 operatora iz tri različite nevladine organizacije koje su primjenjivale svoju obuku i stručnost na zadatak. Zajedno sa skupljenim podacima također pružamo dodatne annotacije o specijalcima demografije, vrsti mržnje i odgovora i povećanju podataka kroz prevod i parafrazaciju. Konačno, pružamo početne eksperimente za procjenu kvalitete naših podataka.Abstract
Encara que hi ha un esforç sense precedents per proporcionar respostes adequades en termes de lleis i polítiques per odiar continguts a les plataformes dels mitjans socials, tractar amb l'odi en línia encara és un problema difícil. Respectar el discurs d'odi de la manera normal de eliminar continguts o suspendre l'usuari pot ser acusada de censura i bloquejar excessivament. Una estratègia alternativa, que fins ara la comunitat de recerca no ha rebut gaire atenció, és opondre's al contingut d'odi amb contranarratives (és a dir, respostes textuals informades). En aquest article, descrivim la creació dels primers parells de dades multilingües basades en experts sobre odi-fala/contranarrativa. Aquest conjunt de dades ha estat construït amb l'esforç de més de 100 operadors de tres ONG diferents que han aplicat la seva formació i experiència a la tasca. Juntament amb les dades recollides també proporcionem anotacions adicionals sobre demogràfics experts, tipus d'odi i resposta, i augment de dades a través de traducció i parafrasió. Finalment, provem experiments inicials per avaluar la qualitat de les nostres dades.Abstract
Ačkoli existuje bezprecedentní snaha poskytnout adekvátní reakce z hlediska zákonů a politik na nenávist obsah na platformách sociálních médií, řešení nenávisti online je stále těžkým problémem. Řešení nenávistných projevů standardním způsobem smazání obsahu nebo pozastavení uživatelů může být obviněno z cenzury a přebytečného blokování. Jednou z alternativních strategií, které zatím výzkumná komunita věnovala málo pozornosti, je skutečně bojovat proti obsahu nenávisti proti vyprávěním (tj. informovaným textovým odpovědím). V tomto článku popisujeme vytvoření prvního rozsáhlého, vícejazyčného datového souboru odborníků založeného na nenávisti-řeči/protinarativních dvojicích. Tento datový soubor byl vytvořen za úsilí více než stovky operátorů ze tří různých nevládních organizací, které na tento úkol uplatnily své školení a odborné znalosti. Spolu se shromážděnými daty poskytujeme také další anotace o odborné demografii, typu nenávisti a reakce a rozšíření dat prostřednictvím překladu a parafrázy. Nakonec poskytujeme počáteční experimenty pro posouzení kvality našich dat.Abstract
Selvom der er en hidtil uset indsats for at give tilstrækkelige svar i form af love og politikker til at hade indhold på sociale medieplatforme, er håndteringen af had online stadig et hårdt problem. Bekæmpelse af hadefuld tale på standardmåde med sletning af indhold eller brugersuspension kan blive anklaget for censur og overblokering. En alternativ strategi, der hidtil har fået lidt opmærksomhed fra forskningssamfundet, er faktisk at modsætte sig hadindhold med kontrafortællinger (dvs. informerede tekstsvar). I denne artikel beskriver vi skabelsen af det første store, flersprogede, ekspertbaserede datasæt af had-tale/kontrafortællingspar. Datasættet er bygget med mere end 100 operatører fra tre forskellige NGO'er, der har anvendt deres uddannelse og ekspertise til opgaven. Sammen med de indsamlede data leverer vi også yderligere noteringer om ekspertdemografi, had og responstype samt dataforøgelse gennem oversættelse og omskrivning. Endelig leverer vi første eksperimenter for at vurdere kvaliteten af vores data.Abstract
Obwohl es beispiellose Anstrengungen gibt, angemessene Antworten in Bezug auf Gesetze und Richtlinien auf Hassinhalte auf Social-Media-Plattformen zu bieten, ist der Umgang mit Hass online immer noch ein schwieriges Problem. Die Bekämpfung von Hassreden in der standardmäßigen Weise der Löschung von Inhalten oder der Sperrung von Benutzern kann wegen Zensur und Überblockung angeklagt werden. Eine alternative Strategie, die bisher wenig Aufmerksamkeit in der Forschungsgemeinschaft erhalten hat, besteht darin, Hassinhalte mit Gegennarrativen (also informierten Textantworten) zu bekämpfen. In diesem Beitrag beschreiben wir die Schaffung des ersten großen, mehrsprachigen, expertenbasierten Datensatzes von Hassrede/Gegenerzählung Paaren. Dieser Datensatz wurde mit der Anstrengung von mehr als hundert Betreibern aus drei verschiedenen NRO erstellt, die ihre Ausbildung und ihr Fachwissen auf die Aufgabe angewendet haben. Zusammen mit den gesammelten Daten liefern wir auch zusätzliche Anmerkungen zu Experten-Demografie, Hass- und Reaktionstypen und Datenaufwandlung durch Übersetzung und Paraphrasierung. Schließlich bieten wir erste Experimente an, um die Qualität unserer Daten zu bewerten.Abstract
Αν και υπάρχει μια πρωτοφανής προσπάθεια για την παροχή επαρκών απαντήσεων από την άποψη νόμων και πολιτικών για το μίσος περιεχομένου στις πλατφόρμες κοινωνικών μέσων, η αντιμετώπιση του μίσους στο διαδίκτυο εξακολουθεί να αποτελεί σκληρό πρόβλημα. Η αντιμετώπιση της ρητορικής μίσους με τον τυποποιημένο τρόπο διαγραφής περιεχομένου ή αναστολής χρήστη μπορεί να κατηγορηθεί για λογοκρισία και υπεραποκλεισμό. Μια εναλλακτική στρατηγική, η οποία έχει λάβει ελάχιστη προσοχή μέχρι στιγμής από την ερευνητική κοινότητα, είναι να αντιταχθούν πραγματικά στο περιεχόμενο μίσους με αντεκηγήσεις (δηλ. ενημερωμένες γραπτές απαντήσεις). Στην παρούσα εργασία, περιγράφουμε τη δημιουργία του πρώτου μεγάλου μεγέθους, πολύγλωσσου, βασισμένου σε εμπειρογνώμονες συνόλου δεδομένων ζευγαριών μίσους-λόγου/αντι-αφήγησης. Αυτό το σύνολο δεδομένων έχει δημιουργηθεί με την προσπάθεια περισσότερων από εκατό φορέων από τρεις διαφορετικές ΜΚΟ που εφάρμοσαν την κατάρτιση και την εμπειρογνωμοσύνη τους στο έργο. Μαζί με τα δεδομένα που συλλέγονται, παρέχουμε επίσης πρόσθετες παρατηρήσεις σχετικά με τη δημογραφία εμπειρογνωμόνων, τον τύπο μίσους και απόκρισης, καθώς και την αύξηση δεδομένων μέσω μετάφρασης και παράφρασης. Τέλος, παρέχουμε αρχικά πειράματα για την αξιολόγηση της ποιότητας των δεδομένων μας.Abstract
Aunque hay un esfuerzo sin precedentes para dar respuestas adecuadas en términos de leyes y políticas al contenido de odio en las plataformas de redes sociales, lidiar con el odio en línea sigue siendo un problema difícil. La lucha contra la incitación al odio de la manera estándar de eliminación de contenido o suspensión de usuarios puede estar acusada de censura y sobrebloqueo. Una estrategia alternativa, que hasta ahora ha recibido poca atención por parte de la comunidad investigadora, es oponerse realmente al contenido de odio con narrativas contrarias (es decir, respuestas textuales informadas). En este artículo, describimos la creación del primer conjunto de datos a gran escala, multilingüe y basado en expertos de parejas de discurso de odio y contra-narrativa. Este conjunto de datos se ha construido con el esfuerzo de más de 100 operadores de tres ONG diferentes que aplicaron su capacitación y experiencia a la tarea. Junto con los datos recopilados, también proporcionamos anotaciones adicionales sobre la demografía de los expertos, el tipo de odio y respuesta, y el aumento de datos mediante la traducción y la paráfrasis. Por último, ofrecemos experimentos iniciales para evaluar la calidad de nuestros datos.Abstract
Kuigi sotsiaalmeedia platvormide vihkamise suhtes on tehtud enneolematuid jõupingutusi piisavate õigusaktide ja poliitikameetmete osas, on vihaga tegelemine internetis endiselt raske probleem. Vihakõne lahendamist sisu kustutamise või kasutaja peatamise standardviisil võidakse süüdistada tsensuuri ja üleblokeerimise eest. Üks alternatiivne strateegia, millele teadusringkond on seni vähe tähelepanu pööranud, on tegelikult vihasisu vastu vastuhavate narratiividega (st teadlike tekstivastustega). Käesolevas töös kirjeldame esimeste suuremahuliste, mitmekeelsete ekspertidel põhinevate vihakõne/vastnarratiivi paaride andmekogumi loomist. See andmekogum on koostatud rohkem kui 100 ettevõtja kolmest erinevast valitsusvälisest organisatsioonist, kes rakendasid ülesande täitmisel oma koolitust ja teadmisi. Koos kogutud andmetega pakume lisamärkusi ekspertide demograafiliste andmete, viha ja vastuse tüübi ning andmete suurendamise kohta tõlke ja parafraseerimise kaudu. Lõpuks pakume esialgseid katseid, et hinnata meie andmete kvaliteeti.Abstract
اگرچه تلاشی پیش از این وجود دارد که به نظر قانون و سیاستهای مناسب جواب داده شود تا از محتوای اجتماعی متنفر شود، در حال حل با نفرت آنلاین هنوز مشکل سختی است. سخنرانی از نفرت در روش استاندارد حذف محتویات یا استفاده از استفاده ممکن است با censorship و overblocking متهم شود. یک استراتژی متفاوت، که تا حالا توجه کمی از جامعه تحقیقات گرفته است، این است که در واقع در مقابل محتوای متنفری با داستانهای مخالف (یعنی واکنشهای متنآموز) مخالف شود. در این کاغذ، ما آفرینش اولین مقیاس بزرگ، بسیار زیادی زبان، مجموعه داده های متخصص از جفت های ناخوشایند/مخالف داستان را توصیف می کنیم. این مجموعه دادهها با تلاش بیش از ۱۰۰ عملیاتر از سه NGO متفاوت ساخته شدهاند که آموزش و مهارت خود را برای این کار استفاده میکنند. همچنین با داده های جمع شده ما در مورد دموگرافیک های متخصص، نفرت و جواب، و افزایش دادهها را از طریق ترجمه و پارافریزش، اطلاعات اضافه میکنیم. بالاخره، ما آزمایشات اولیه را برای ارزیابی کیفیت دادههایمان فراهم میکنیم.Abstract
Vaikka sosiaalisen median alustoilla on ennennäkemätöntä pyrkimystä tarjota riittäviä vastauksia lakeihin ja politiikkoihin vihasisällön torjumiseksi, viha verkossa on edelleen kova ongelma. Vihanpuheen torjumista sisällön poistamisen tai käyttäjän keskeyttämisen tavanomaisella tavalla voidaan syyttää sensuurista ja ylivestosta. Yksi vaihtoehtoinen strategia, johon tutkimusyhteisö on tähän mennessä kiinnittänyt vähän huomiota, on vihasisällön vastustaminen vastakertomuksilla (eli tietoon perustuvilla tekstivasteilla). Tässä artikkelissa kuvailemme ensimmäisten laaja-alaisten monikielisten asiantuntijapohjaisten tietokokonaisuuksien luomista vihapuheen/vastakerronnan pareista. Tämä aineisto on rakennettu yli 100 toimijan voimin kolmesta eri kansalaisjärjestöstä, jotka sovelsivat tehtävään koulutustaan ja asiantuntemustaan. Yhdessä kerättyjen tietojen kanssa tarjoamme myös lisähuomautuksia asiantuntijaväestöstä, viha- ja vastaustyypistä sekä tiedon lisäämisestä käännöksen ja parafrasoinnin avulla. Lopuksi tarjoamme alustavia kokeita datamme laadun arvioimiseksi.Abstract
Bien qu'il existe un effort sans précédent pour apporter des réponses adéquates en termes de lois et de politiques au contenu haineux sur les plateformes de médias sociaux, la gestion de la haine en ligne reste un problème difficile. La lutte contre les discours haineux par la méthode standard de suppression de contenu ou de suspension d'utilisateur peut être accusée de censure et de surblocage. Une autre stratégie, qui a reçu peu d'attention de la part de la communauté des chercheurs jusqu'à présent, consiste à s'opposer au contenu haineux par des contre-discours (c'est-à-dire des réponses textuelles informées). Dans cet article, nous décrivons la création du premier ensemble de données multilingue à grande échelle, basé sur des experts, de paires discours de haine/contre-récit. Ce jeu de données a été créé grâce aux efforts de plus de 100 opérateurs de trois ONG différentes qui ont appliqué leur formation et leur expertise à la tâche. Avec les données collectées, nous fournissons également des annotations supplémentaires sur les données démographiques des experts, les types de haine et de réponse, et l'augmentation des données par traduction et paraphrase. Enfin, nous proposons des expériences initiales pour évaluer la qualité de nos données.Abstract
Cé go bhfuil iarracht gan fasach ann freagraí leordhóthanacha a sholáthar i dtéarmaí dlíthe agus beartais chun fuath a bhaint as ábhar ar ardáin na meán sóisialta, is fadhb chrua fós é déileáil le fuath ar líne. Féadfar cinsireacht agus ró-bhloic a ghearradh as dul i ngleic le fuathchaint ar an mbealach caighdeánach chun ábhar a scriosadh nó a fhionraí. Straitéis mhalartach amháin, nár thug an pobal taighde mórán airde uirthi go dtí seo, ná cur i gcoinne ábhar fuatha le frith-inste (i.e. freagraí eolasacha téacs). Sa pháipéar seo, déanaimid cur síos ar chruthú an chéad tacar sonraí ar scála mór, ilteangach, bunaithe ar shaineolaithe de phéirí fuathchainte/frithinsinte. Tógadh an tacar sonraí seo le hiarracht níos mó ná 100 oibreoir ó thrí ENR éagsúla a chuir a gcuid oiliúna agus saineolais i bhfeidhm ar an tasc. In éineacht leis na sonraí a bhailímid cuirimid nótaí breise ar fáil freisin faoi shain-dhéimeagrafaic, fuath agus cineál freagartha, agus méadú ar shonraí trí aistriúchán agus athinsint. Ar deireadh, cuirimid turgnaimh tosaigh ar fáil chun cáilíocht ár sonraí a mheas.Abstract
Ingawa da ba ta gabãta ba, akwai aikin ka bãyar da majibu masu inganci a cikin misãlai da kisa dõmin su ƙi contenti a kan mitandan jamii, kuma masu husũma da ƙeta ne akan mitandaki, sai yana da wata masĩfa mai tsanani. Suna danna magana na ƙeta cikin hanyar da aka daidaita cire masu ƙunci ko cewa mai amfani da shi, za'a iya zartar da censorship da surokin. Babu wani taki mai musanya, wanda ya motsa muhimman da jama'a na fasihi, yana kange tsarin hatsi da bakin-bakwai (misali, musamman da aka sani). Ina bayyana a cikin wannan takardan, ko kuma za mu bayyana halittar ma'abũcin farko mai girma, da mulki-lugha, da danne masu bastarwa na danasãri na haske-faɗi/motsi-biyu. An gina wannan dataset da aka yi aikin baya da wasu afareta 100 daga wasu ma'abũta taraki uku na dabam-dabam masu shiryuwa da masu sani zuwa aikin. Daga da data wanda aka samirta, za mu ga bayani masu ƙaranci masu hususann mutumari, nau'in ƙiyayya da jibar da kuma ƙara data game da fassarar da fassarar. Haƙĩƙa, Munã ƙara da jarrabai na farko dõmin Mu ƙaddara sifar data.Abstract
למרות שיש מאמץ בלתי קודם לספק תגובות מתאימות במונחים של חוקים ומדיניות לשנוא תוכן במתקנות תקשורת חברתית, להתמודד עם שנאה באינטרנט היא עדיין בעיה קשה. להתמודד עם נאום שנאה בדרך הסטנדרטית של מחיקת התוכן או שינוי משתמש יכול להיות מאשים על סנזורה ומחסום יתר. אסטרטגיה אחת חלופית, אשר קיבלה מעט תשומת לב עד כה על ידי קהילת המחקר, היא למעשה להתנגד לתוכן שנאה עם סיפורים נגד (כלומר תגובות הודעות טקסטיות). בעיתון הזה, אנחנו מתארים את יצירת המידע הגדול הראשון של זוגות שנאה-נאום/נגד-סיפור. קבוצת נתונים זו נבנתה עם מאמץ של יותר מ-100 מנהלים משלושה ארגונים לא-ממשלתיים שונים שהפעילו את האימונים והמומחיות שלהם למשימה. יחד עם הנתונים האסופים אנחנו גם מספקים ציונים נוספים על דמוגרפיה מומחית, סוג שנאה ותגובה, וגדלת נתונים דרך תרגום ופרphrasing. סוף סוף, אנחנו מספקים ניסויים ראשונים כדי להעריך את איכות הנתונים שלנו.Abstract
हालांकि सोशल मीडिया प्लेटफार्मों पर सामग्री से नफरत करने के लिए कानूनों और नीतियों के संदर्भ में पर्याप्त प्रतिक्रियाएं प्रदान करने का एक अभूतपूर्व प्रयास है, ऑनलाइन नफरत से निपटना अभी भी एक कठिन समस्या है। सामग्री हटाने या उपयोगकर्ता निलंबन के मानक तरीके से नफरत भरे भाषण से निपटने पर सेंसरशिप और ओवरब्लॉकिंग का आरोप लगाया जा सकता है। एक वैकल्पिक रणनीति, जिसे अनुसंधान समुदाय द्वारा अब तक बहुत कम ध्यान दिया गया है, वास्तव में काउंटर-कथाओं (यानी सूचित पाठ्य प्रतिक्रियाओं) के साथ नफरत सामग्री का विरोध करना है। इस पेपर में, हम नफरत-भाषण / काउंटर-कथा जोड़े के पहले बड़े पैमाने पर, बहुभाषी, विशेषज्ञ-आधारित डेटासेट के निर्माण का वर्णन करते हैं। यह डेटासेट तीन अलग-अलग गैर-सरकारी संगठनों के 100 से अधिक ऑपरेटरों के प्रयास से बनाया गया है जिन्होंने कार्य के लिए अपने प्रशिक्षण और विशेषज्ञता को लागू किया है। एकत्र किए गए डेटा के साथ हम विशेषज्ञ जनसांख्यिकी, घृणा और प्रतिक्रिया प्रकार, और अनुवाद और व्याख्या के माध्यम से डेटा वृद्धि के बारे में अतिरिक्त एनोटेशन भी प्रदान करते हैं। अंत में, हम अपने डेटा की गुणवत्ता का आकलन करने के लिए प्रारंभिक प्रयोग प्रदान करते हैं।Abstract
Iako postoji neprecedentni napor za pružanje odgovarajućih odgovora u smislu zakona i politike za mržnju sadržaja na platformama društvenih medija, rješavanje mržnje na internetu još uvijek je težak problem. Uzimanje govora mržnje na standardan način obrisanja sadržaja ili suspenzije korisnika može biti optuženo za cenzuru i prekoračenje. Jedna druga strategija, koja je do sada dobila malo pažnje od strane istraživačke zajednice, je zapravo protiv sadržaja mržnje protiv priče (tj. informativne tekstualne odgovore). U ovom papiru opisujemo stvaranje prve velike, multijezičke, stručne podatke o razgovoru mržnje/protivnih parova. Ova kompleta podataka je izgrađena s naporima više od 100 operatora iz tri različite nevladine organizacije koje su primjenjivale svoju obuku i stručnost na zadatak. Zajedno s prikupljenim podacima pružamo i dodatne annotacije o tipu stručnih demografija, mržnje i odgovora i povećanju podataka preko prevoda i parafrazacije. Konačno, pružamo početne eksperimente za procjenu kvalitete naših podataka.Abstract
Bár példátlan erőfeszítések történnek arra, hogy megfelelő válaszokat adjunk a közösségi média platformokon található tartalmak gyűlöletére vonatkozó törvények és politikák tekintetében, az online gyűlölet kezelése még mindig nehéz problémát jelent. A gyűlöletbeszéd elleni küzdelem a tartalom törlésének vagy a felhasználók felfüggesztésének szokásos módjával történő kezelése cenzúrával és túlblokkolással vádolható. Az egyik alternatív stratégia, amelyet eddig kevés figyelmet kapott a kutatóközösség, az, hogy ténylegesen ellennarratívákkal (azaz tájékozott szöveges válaszokkal) szembenézzünk a gyűlölettartalommal. Jelen tanulmányban bemutatjuk a gyűlölet-beszéd/ellenelbeszélő párok első nagyszabású, többnyelvű, szakértői alapú adathalmazának létrehozását. Ezt az adatkészletet három különböző civil szervezet több mint 100 üzemeltetőjének erőfeszítésével építették ki, akik képzésüket és szakértelmüket alkalmazták erre a feladatra. Az összegyűjtött adatokkal együtt további megjegyzéseket adunk a szakértői demográfiai adatokról, a gyűlölet és a válasz típusáról, valamint az adatok fordításával és parafrázásával történő kiterjesztéséről. Végül kezdeti kísérleteket végezünk adataink minőségének felmérésére.Abstract
Չնայած աննախադեպ փորձ կա ապահովել բավարար պատասխաններ օրենքների և քաղաքականության առումով՝ ատելու պարունակությունը սոցիալական լրատվամիջոցների պլատֆորմերում, ատելու առցանց դեռևս դժվար խնդիր է: Հատելության խոսքի վերաբերյալ պարունակության ջնջման ստանդարտ ձևով կամ օգտագործողի կախվածությամբ կարող է մեղադրվել ցենզուրայի և չափազանց արգելափակության պատճառով: Մի այլընտրանքային ռազմավարություն, որը մինչ այժմ փոքր ուշադրություն է դարձել հետազոտող համայնքի կողմից, իրականում հակառակվում է ատելության պարունակությանը հակապատմություններով (այսինքն՝ տեղեկացված տեքստային արձագանքներով): Այս թղթի մեջ մենք նկարագրում ենք ատելության խոսքի և հակապատմության զույգերի առաջին մեծ, բազլեզու, մասնագետների հիմնված տվյալների համակարգը: Այս տվյալների համակարգը կառուցվել է ավելի քան 100 օպերատորների ջանքերով երեք տարբեր ՀԿ-ից, որոնք կիրառեցին իրենց ուսուցման և մասնագիտության գործընթացը: Հաւաքված տվյալների հետ միասին մենք նաև ներկայացնում ենք ավելին annoտացիաներ մասնագետների դեմոգրաֆիկայի, ատելության և պատասխանի տեսակի մասին, և տվյալների աճի մասին թարգմանման և պարաֆրեզիաների միջոցով: Վերջապես, մենք առաջին փորձեր ենք տրամադրում մեր տվյալների որակը գնահատելու համար:Abstract
Meskipun ada usaha yang belum pernah terjadi untuk memberikan respon yang cukup dalam hal hukum dan kebijakan untuk membenci isi di platform media sosial, menghadapi kebencian online masih masalah yang sulit. Mengatasi pidato kebencian dengan cara standar penghapusan konten atau penggantian pengguna mungkin ditugaskan dengan censura dan overblocking. Satu strategi alternatif, yang telah menerima sedikit perhatian sejauh ini oleh komunitas penelitian, adalah untuk menentang konten kebencian dengan kontro-narratives (i.e. respon tekstual yang diberitahu). In this paper, we describe the creation of the first large-scale, multilingual, expert-based dataset of hate-speech/counter-narrative pairs. This dataset has been built with the effort of more than 100 operators from three different NGOs that applied their training and expertise to the task. Bersama dengan data yang dikumpulkan kami juga memberikan anotasi tambahan tentang demografi ahli, tipe kebencian dan respon, dan peningkatan data melalui terjemahan dan parafrasa. Akhirnya, kami menyediakan percobaan awal untuk menilai kualitas data kami.Abstract
Sebbene vi sia uno sforzo senza precedenti per fornire risposte adeguate in termini di leggi e politiche per odiare i contenuti sulle piattaforme di social media, affrontare l'odio online è ancora un problema difficile. Affrontare l'incitamento all'odio nel modo standard di cancellazione dei contenuti o sospensione degli utenti può essere accusato di censura e blocco eccessivo. Una strategia alternativa, che finora ha ricevuto poca attenzione dalla comunità di ricerca, è quella di contrastare effettivamente i contenuti di odio con contronarrazioni (cioè risposte testuali informate). In questo articolo, descriviamo la creazione del primo dataset su larga scala, multilingue e basato su esperti di coppie hate-speech/contro-narrative. Questo set di dati è stato costruito con lo sforzo di oltre 100 operatori di tre diverse ONG che hanno applicato la loro formazione e competenza al compito. Insieme ai dati raccolti forniamo anche annotazioni aggiuntive su dati demografici esperti, tipo di odio e risposta e aumento dei dati attraverso traduzione e parafrasi. Infine, forniamo esperimenti iniziali per valutare la qualità dei nostri dati.Abstract
ソーシャルメディアプラットフォーム上のコンテンツを憎悪するための法律や政策の観点から適切な対応を提供するための前例のない努力がありますが、オンラインでの憎悪への対処は依然として困難な問題です。 ヘイトスピーチへの対処は、コンテンツの削除やユーザーの停止の標準的な方法で行われ、検閲やオーバーブロックの罪に問われることがあります。 研究コミュニティから今のところほとんど注目されていない代替戦略の1つは、実際には反対の記述(すなわち、情報に基づいたテキストの回答)を伴うヘイトコンテンツに反対することである。 この論文では、ヘイトスピーチ/反物語ペアの最初の大規模な、多言語、専門家ベースのデータセットの作成について説明します。 このデータセットは、トレーニングと専門知識をタスクに適用した3つの異なるNGOからの100人以上のオペレーターの努力によって構築されました。 収集されたデータとともに、専門家の人口統計、ヘイトとレスポンスの種類、翻訳とパラフレーズによるデータ拡張に関する追加の注釈も提供しています。 最後に、データの品質を評価するための初期実験を提供します。Abstract
Sing sampeyan ora nganggo perbudhakan sing gak bukane nggawe aturan luwih dumadhi kanggo nggawe aturan hukum lan politik sing kanggo nggihi nggawe barang media-soko, iso nglanggar nggarap kuwi nggih kuwi mau, sing paling nggih kuwi mau. politenessoffpolite"), and when there is a change ("assertivepoliteness Alternate Nan pepulan iki, kita ngubah perusahaan nganggo perusahaan lang, akeh multilengu, dataset sing basa na perusahaan karo unwitan-neswih/iso ngregani dataset iki ono wektu nggawe sawalih luwih akeh operar liyane karo telu mengko NGO sing paling apik tur angel karo perangkat ingkang sapa kerjane kanggo nguasakno Jejaring Lha wih-wih, awak dhéwé nyenggawe perintah sing sampeyan kanggo nyenggawe kaliwat dadi awak dhéwé.Abstract
მაგრამ არსებობს წესების და პოლიტიკის შესახებ, რომელიც სოციალური მედია პლატატრუმენტების შესახებ წესების და პოლიტიკის შესახებ, საკუთარი მედია პლატატრუმენტებში მუშ შესაძლებელია ცენსორცია და ძალიან ბლოკურაციის სტანდარტურად წაშლა ან გამოყენებელი სცენსორციის სტანდარტურად წაშლა. ერთი სხვა სტრატიგია, რომელიც საკითხვა საზოგადოებო საზოგადოებო საზოგადოებო შესახებ უფრო ცოტა აღმოჩენა, არის ის, რომ საკითხვა მპატის შემდგომარების შესახებ კო ამ დოკუნეში ჩვენ აღწერეთ პირველი დიდი, მრავალური, ექსპერტიური დაბათებული მონაცემების შექმნა/კონტრეტური პარატიური ზოგების შექმნა. ეს მონაცემების კონფიგურაცია სამი განსხვავებული NGOs-დან უფრო მეტი 100-ზე მეტი ოპერატორის ძალიან შექმნა, რომლებიც სამუშაო სამუშაო განსხვავებული ჩვენ კოლექცირებული მონაცემების ერთმანეთით ექსპერტის დემოგრაფიკის, მპარების და პასუხის ტიპის, და მონაცემების აზექტირება შემდეგ დამატებული მონაცემები და პაპაფ საბოლოოდ, ჩვენ დავიწყებთ პირველი ექსპერიმენტები, რომელიც ჩვენი მონაცემების კაalitეტის შესაბამისათვის.Abstract
Егер социалдық медиа платформаларында мазмұнын қарамастыру үшін дұрыс жауап беру үшін, онлайн жұмыс істеу жұмыс істеу әрекетті жауап беру әрекеттері бар. Мазмұнын өшіру немесе пайдаланушының күту стандартты жолдарының сөйлемесін басқару жағдайда тензорстық және бұғаттауға көмектесуі мүмкін. Бір басқа стратегия, зерттеулер қоғамдарының көп қызықтығын жеткізген кезде, қарсы айтқандардың мазмұнына қарсы болу (т.е. мәтіндік жауап беру). Бұл қағазда бірінші үлкен, көптілік, эксперт-негіздеген деректер жинағын жасап береміз. Бұл деректер жинағы тапсырмаға оқыту және кәсіпке қолданатын үш түрлі НПО-дан 100-ден артық операторлардың жұмысынан құрылды. Біріктірілген деректермен бірге бірге эксперттердің демографиялары, қарсы және жауап түрі және деректерді аудару және парфразу арқылы қосымша жазбаларды береміз. Соңында, біз деректердің сапасын оқу үшін бастапқы тәжірибелерін береміз.Abstract
소셜미디어 플랫폼의 증오 내용에 대해 법률과 정책 측면에서 전대미문의 대응을 했지만 온라인 증오를 다루는 것은 여전히 까다로운 문제다.혐오 발언을 콘텐츠를 삭제하거나 이용자 사용을 일시 중단하는 표준으로 다루는 것은 심사와 과도한 봉쇄 혐의를 받을 수 있다.지금까지 연구계가 주목하지 않았던 또 다른 전략은 혐오 내용을 반 서사(즉 알 수 있는 텍스트 응답)로 반대하는 것이다.본고에서 우리는 첫 번째 대규모, 다중 언어, 전문가를 바탕으로 하는 증오 언론/반 서사가 데이터 집합에 대한 창설을 묘사했다.이 데이터 집합은 세 개의 서로 다른 비정부 조직의 100여 명의 조작원들의 노력으로 만들어진 것으로, 그들은 자신의 교육과 전문 지식을 이 임무에 응용했다.수집된 데이터 외에 전문가의 인구 통계, 증오와 반응 유형에 대한 추가 주석과 번역과 해석을 통해 증가한 데이터도 제공했다.마지막으로, 우리는 데이터의 질을 평가하기 위해 초보적인 실험을 제공한다.Abstract
Nors iki šiol stengiamasi tinkamai reaguoti į įstatymus ir politiką, kad neapykantų turinio social in ės žiniasklaidos platformose, kova su neapykanta internete vis dar yra sunki problem a. Neapykantos kalbos sprendimas standartiniu turinio ištrinimo būdu arba vartotojo sustabdymo būdu gali būti apkaltintas cenzūra ir pernelyg dideliu blokavimu. One alternate strategy, that has received little attention so far by the research community, is to actually oppose hate content with counter-narratives (i.e. informed textual responses). Šiame dokumente apibūdiname pirmųjų didelio masto, daugiakalbių, ekspertų pagrįstų neapykantos kalbos ir priešpasakojimo poros duomenų rinkinį. Šis duomenų rinkinys buvo sukurtas naudojant daugiau kaip 100 operatorių iš trijų skirtingų NVO, kurios šioje užduotyje taikė savo mokymą ir patirtį. Kartu su surinktais duomenimis mes taip pat pateikiame papildomas pastabas apie ekspertų demografiją, neapykantos ir atsako tipą ir duomenų didinimą vertimo ir parafrazės būdu. Galiausiai teikiame pradinius eksperimentus mūsų duomenų kokybei įvertinti.Abstract
Иако постојат непретходни напори за обезбедување соодветни одговори во поглед на законите и политиките за мраза на социјалните медиуми, справувањето со омразата онлајн е сé уште тежок проблем. Да се справи со говорот на омраза на стандарден начин на избришување на содржината или суспензија на корисникот може да биде обвинет за цензура и преблокирање. Една алтернативна стратегија, која досега доби мало внимание од страна на истражувачката заедница, е всушност да се спротивстави на содржината на омразата со контра-приказни (т.е. информирани текстуални одговори). Во овој весник, го опишуваме создавањето на првите големи, мултијазични, експертски базирани податоци на парови на омраза-говор/контра-приказни. Овој податок е изграден со напорите на повеќе од 100 оператори од три различни невладини организации кои ја применија својата обука и експертиза за задачата. Заедно со собраните податоци, ние исто така обезбедуваме дополнителни анотации за експертската демографија, типот на омраза и одговор, и зголемување на податоците преку превод и парафразирање. Конечно, ние обезбедуваме првични експерименти за проценка на квалитетот на нашите податоци.Abstract
നിയമങ്ങളും പൌലീസുകളും നിയമങ്ങളും വെറുക്കാനുള്ള നിയമങ്ങളും നിയമങ്ങളും നേരിടാന് മുമ്പ് ഒരു ശ്രമം ഉണ്ടെങ്കിലും സാമൂഹ്യ മീഡിയ പ്ലാറ്റ് വെറുപ്പ് സംസാരം സാധാരണ മാറ്റുന്നതിന്റെയോ ഉപയോക്താവിന്റെയോ സെന്സെര്ഷഷിപ്പിന്റെയും അധികം തടഞ്ഞതിന പരിശോധന സമൂഹത്തില് നിന്ന് വളരെ കുറച്ച് ശ്രദ്ധ കിട്ടിയ ഒരു മറ്റൊരു strategy, യഥാര്ത്ഥത്തില് വെറുപ്പുള്ള വിവരങ്ങള്കൊണ്ട് വെറുപ്പുകളു ഈ പത്രത്തില്, നമ്മള് ആദ്യത്തെ വലിയ വലിപ്പം സൃഷ്ടിക്കുന്നത് വിശദീകരിക്കുന്നു, പല ഭാഷ, വിശേഷിപ്പിക്കുന്ന വിദ്വേഷ-വാക ഈ ഡാറ്റാസെറ്റ് നിര്മ്മിക്കപ്പെട്ടിരിക്കുന്നു. മൂന്നു വ്യത്യസ്ത പ്രമാണങ്ങളില് നിന്നും 100 കൂടുതല് ഓപ്പറേറ്റര് സംഘടിപ്പിക്കപ്പെട്ട വിവരങ്ങളുടെ കൂട്ടത്തില് വിശിഷ്ടന്മാരുടെ ഡെമോഗ്രാഫിക്ക്, വെറുപ്പും പ്രതികരണം തരം എന്നിവയെ കൂടുതല് അവസാനം, നമ്മുടെ വിവരങ്ങളുടെ മാത്രം പരീക്ഷണങ്ങള് പരിശോധിക്കാന് ഞങ്ങള് നല്കുന്നു.Abstract
Хэдийгээр нийгмийн мэдээллийн хэлбэрээс үзэн ядах бодлогыг үзэх хууль болон бодлогын тухай адилхан хариу өгөх зорилготой байдаг ч, онлайн хувьд үзэн ядах нь хэцүү асуудал юм. Харамсалтай яриаг хэрэглэгчдийн устгах эсвэл хэрэглэгчдийн устгах стандарт арга хэмжээнд хүлээн зөвшөөрөх, дутуу бэрхшээлтэй шаардлагатай байж болно. Судалгааны нийгэмд бага анхаарал авсан өөр өөр нэг стратеги бол эсрэг өгүүлэлтээс харьцуулах үзэн ядуурлаас эсрэг харьцуулах юм. Энэ цаасан дээр бид анхны том хэмжээний, олон хэлний, мэргэжлийн үндсэн өгөгдлийн санг үзэн ядах-ярианы/эсрэг зохиолын хоёр бүтээхийг тайлбарлаж байна. Энэ өгөгдлийн санг ажил дээр суралцах болон мэргэжлийг ашиглан гурван өөр НҮБ-ээс 100 гаруй операторын хичээл зориулсан. Мөн цуглуулсан өгөгдлийн хамтдаа бид мэргэжилтнүүдийн демографик, үзэн ядах, хариу үйлдэл төрлийн тухай нэмэлт илтгэл өгдөг. Мөн өгөгдлийн нэмэлт илтгэл хөгжүүлэх, хэлбэр Эцэст нь бид эхний туршилтыг өгөгдлийн сайн талаар үнэлэх хэрэгтэй.Abstract
Walaupun terdapat usaha yang belum pernah berlaku untuk memberikan jawapan yang sesuai dalam terma undang-undang dan polisi untuk benci kandungan di platform media sosial, menangani kebencian online masih masalah yang sukar. Mengatasi ucapan kebencian dengan cara piawai pemadaman kandungan atau penggantian pengguna mungkin ditugaskan dengan censura dan penghalangan berlebihan. Satu strategi alternatif, yang telah menerima sedikit perhatian sejauh ini oleh komuniti penyelidikan, adalah sebenarnya menentang kandungan kebencian dengan kontranarratives (iaitu balasan teks yang diberitahu). In this paper, we describe the creation of the first large-scale, multilingual, expert-based dataset of hate-speech/counter-narrative pairs. Set data ini telah dibina dengan usaha lebih dari 100 operator dari tiga NGO yang berlainan yang melaksanakan latihan dan keahlian mereka untuk tugas. Bersama dengan data yang dikumpulkan kami juga menyediakan anotasi tambahan mengenai demografi ahli, jenis kebencian dan balas, dan peningkatan data melalui terjemahan dan parafrasa. Akhirnya, kami menyediakan eksperimen awal untuk menilai kualiti data kami.Abstract
Għalkemm hemm sforz bla preċedent biex jiġu pprovduti reazzjonijiet adegwati f’termini ta’ liġijiet u politiki biex jinqered il-kontenut fuq pjattaformi tal-midja soċjali, it-trattament tal-mibegħda onlajn għadu problem a diffiċli. L-indirizzar tad-diskors tal-mibegħda bil-mod standard tat-tħassir tal-kontenut jew is-sospensjoni tal-utent jista’ jkun akkużat biċ-ċensura u l-imblukkar żejjed. Strateġija alternattiva waħda, li s’issa ftit irċeviet attenzjoni mill-komunità tar-riċerka, hija li fil-fatt jopponi kontenut ta’ mibegħda b’kontro-narrattivi (jiġifieri reazzjonijiet testwali infurmati). F’dan id-dokument, aħna niddeskrivu l-ħolqien tal-ewwel sett ta’ dejta fuq skala kbira, multilingwi, ibbażat fuq esperti ta’ pari ta’ mibegħda-diskors/kontro-narrattivi. Dan is-sett ta’ dejta nbena bl-isforz ta’ aktar minn 100 operatur minn tliet NGOs differenti li applikaw it-taħriġ u l-għarfien espert tagħhom għall-kompitu. Flimkien mad-dejta miġbura nagħtu wkoll annotazzjonijiet addizzjonali dwar id-demografija esperta, it-tip ta’ mibegħda u reazzjoni, u żieda fid-dejta permezz tat-traduzzjoni u l-parafrażizzazzjoni. Fl-aħħar nett, nagħtu esperimenti inizjali biex tivvaluta l-kwalità tad-dejta tagħna.Abstract
Hoewel er een ongekende inspanning is om adequate antwoorden te bieden in termen van wetten en beleid op haat inhoud op sociale media platforms, is omgaan met haat online nog steeds een moeilijk probleem. Het aanpakken van haatspraak op de standaard manier van het verwijderen van inhoud of het opschorten van gebruikers kan worden aangeklaagd voor censuur en overbelocking. Een alternatieve strategie, die tot nu toe weinig aandacht heeft gekregen door de onderzoeksgemeenschap, is om hate content daadwerkelijk te verzetten met contra-narratives (dat wil zeggen geïnformeerde tekstreacties). In dit artikel beschrijven we de creatie van de eerste grootschalige, meertalige, deskundige dataset van haat-spraak/tegennarratieve paren. Deze dataset is opgebouwd met de inspanning van meer dan honderd exploitanten van drie verschillende NGO's die hun opleiding en expertise op de taak hebben toegepast. Samen met de verzamelde gegevens bieden we ook aanvullende annotaties over expertdemografie, haat- en responstype, en data augmentatie door vertaling en parafrasering. Tot slot verzorgen we eerste experimenten om de kwaliteit van onze data te beoordelen.Abstract
Selv om det finst eit ukjend forsøk for å gje tilstrekkelege svar ved hjelp av lovgivnader og politikk for å hatera innhaldet på sosiale mediaplattformar, er det fortsatt eit vanskeleg problem å handtera hatt på nettet. Å trykkja hatspråk på standardverdien for å sletta innhaldet eller brukarutstyring kan verta lasta med censorskap og oversblokkering. Eit alternativ strategi, som har fått liten oppmerksomhet så langt av forskningssamfunnet, er å faktisk opposera hate-innhaldet med kontranarrativ (t.d. informert tekstutgåver). I denne papiret beskriver vi opprettinga av dei første store, multispråk, ekspertbaserte datasetta av hatespråk/mottale par. Denne datasettet er bygd med innpålet av fleire enn 100 operatorar frå tre ulike NGO som har brukt opplæringa og ekspertisering til oppgåva. Samtidig med samlingsdata, har vi også tillegg til merknader om ekspertdemografikk, hatt og svartype, og data økning gjennom omsetjing og parafrasing. I slutt tilbyr vi første eksperimenter for å vurdere kvaliteten til data våre.Abstract
Chociaż podejmowane są bezprecedensowe wysiłki na rzecz zapewnienia odpowiednich reakcji w zakresie prawa i polityki na nienawiść treści na platformach mediów społecznościowych, radzenie sobie z nienawiścią w Internecie jest ciężkim problemem. Zwalczanie mowy nienawiści w standardowym sposobie usuwania treści lub zawieszenia użytkownika może być oskarżone o cenzurę i nadblokowanie. Jedną alternatywną strategią, której dotychczas niewiele uwagi społeczności badawczej jest faktyczne przeciwstawienie treściom nienawiści kontrnarracjami (tj. świadomymi odpowiedziami tekstowymi). W niniejszym artykule opisujemy stworzenie pierwszego wielkoskalowego, wielojęzycznego, opartego na ekspertach zestawu danych par nienawiści/przeciw-narracji. Ten zestaw danych został zbudowany z wysiłkiem ponad stu operatorów z trzech różnych organizacji pozarządowych, które wykorzystały swoje szkolenia i wiedzę fachową do tego zadania. Wraz z zebranymi danymi dostarczamy również dodatkowych adnotacji dotyczących ekspertów demograficznych, typu nienawiści i reakcji oraz powiększania danych poprzez tłumaczenie i parafrazowanie. Wreszcie udostępniamy wstępne eksperymenty w celu oceny jakości naszych danych.Abstract
Embora haja um esforço sem precedentes para fornecer respostas adequadas em termos de leis e políticas para o ódio ao conteúdo nas plataformas de mídia social, lidar com o ódio online ainda é um problema difícil. Combater o discurso de ódio da maneira padrão de exclusão de conteúdo ou suspensão de usuários pode ser acusado de censura e superbloqueio. Uma estratégia alternativa, que recebeu pouca atenção até agora da comunidade de pesquisa, é realmente opor o conteúdo de ódio com contra-narrativas (ou seja, respostas textuais informadas). Neste artigo, descrevemos a criação do primeiro conjunto de dados em larga escala, multilíngue e baseado em especialistas de pares discurso de ódio/contra-narrativa. Este conjunto de dados foi construído com o esforço de mais de 100 operadores de três ONGs diferentes que aplicaram seu treinamento e experiência na tarefa. Juntamente com os dados coletados, também fornecemos anotações adicionais sobre dados demográficos de especialistas, tipo de ódio e resposta e aumento de dados por meio de tradução e paráfrase. Por fim, fornecemos experimentos iniciais para avaliar a qualidade de nossos dados.Abstract
Deși există un efort fără precedent de a oferi răspunsuri adecvate în ceea ce privește legile și politicile de ură a conținutului de pe platformele de social media, abordarea urăi online este încă o problemă dificilă. Combaterea discursului la ură în modul standard de ștergere a conținutului sau suspendare a utilizatorilor poate fi acuzată de cenzură și suprablocare. O strategie alternativă, care a primit puțină atenție până în prezent de către comunitatea de cercetare, este de a se opune de fapt conținutului de ură cu contranarațiuni (adică răspunsuri textuale informate). În această lucrare, descriem crearea primului set de date la scară largă, multilingvă, bazat pe experți, de perechi de discursuri de ură/contranarațiune. Acest set de date a fost construit cu efortul a mai mult de 100 de operatori din trei ONG-uri diferite care și-au aplicat formarea și expertiza în această sarcină. Împreună cu datele colectate, oferim, de asemenea, adnotări suplimentare despre demografia experților, tipul de ură și răspuns și mărirea datelor prin traducere și parafrazare. În cele din urmă, oferim experimente inițiale pentru a evalua calitatea datelor noastre.Abstract
Хотя предпринимаются беспрецедентные усилия по обеспечению адекватных мер реагирования с точки зрения законов и политики, направленных на ненависть к контенту на платформах социальных сетей, борьба с ненавистью в Интернете по-прежнему является сложной проблемой. Обработка ненавистнических высказываний стандартным способом удаления контента или приостановки пользователя может быть обвинена в цензуре и блокировке. Одна альтернативная стратегия, которой до сих пор уделялось мало внимания со стороны исследовательского сообщества, заключается в том, чтобы на самом деле противостоять содержанию ненависти с помощью контрнаративов (т.е. информированных текстовых ответов). В этой статье мы описываем создание первого крупномасштабного, многоязычного, основанного на экспертах набора данных о парах ненавистнических высказываний/контрнаративов. Этот набор данных был создан при участии более 100 операторов из трех различных НПО, которые использовали свои знания и опыт для решения этой задачи. Вместе с собранными данными мы также предоставляем дополнительные аннотации о демографических характеристиках экспертов, типе ненависти и реакции, а также расширении данных путем перевода и перефразирования. Наконец, мы проводим первоначальные эксперименты для оценки качества наших данных.Abstract
නමුත් සාමාජික මාධ්යමාධ්යම ප්රවේශයක් විරුද්ධ කරන්න නීතිය සහ ප්රවේශනයක් නිර්මාණය සඳහා සාමාජික මාධ්යමාධ්යම ප් ප්රමාණය සඳහා ප්රමාණය සඳහා භාවිතාකරණය සඳහා ප්රමාණය සඳහා ප්රමාණය සඳහා විරෝධය සඳහා ක්රියාත්මක කතා පරීක්ෂණ සමාජයෙන් ප්රතික්රියාත්මක වෙනස් විදිහට අවධානයක් ලැබුනා, ඇත්තටම ප්රතික්රියාත්මක විරුද්ධ විරුද්ධ වි මේ පැත්තට, අපි පළමු ලොකු ප්රමාණයක්, බොහොම භාෂාවක්, විශ්වාසිත දත්ත සූද්ධානයක් විස්තර කරනවා විශ්වාස කරන්න මේ දත්ත සෙට් හදලා තියෙන්නේ වෙනස් NGOs තුනක් වඩා වැඩි ඔපරේටර් 100ක් වඩා ප්රයෝජනය කරනවා ඒ වගේම ඔවුන්ගේ ප්රයෝ සම්බන්ධ දත්ත සමග අපි විශ්වාසිත ප්රතිචාරය, විරෝධය සහ ප්රතික්රියාත්මක වගේ විශේෂය ගැන තවත් ප්රතික්රියාව අන්තිමේදි, අපි පටන් ගත්ත පරීක්ෂණ ප්රයෝජනය කරනවා අපේ දත්තේ ගොඩක් ගොඩක් විශේෂ කරන්න.Abstract
Čeprav so si prizadevanja za zagotavljanje ustreznih odzivov v smislu zakonov in politik proti sovražnim vsebinam na platformah družbenih omrežij še vedno težka. Obravnavanje sovražnega govora na standardni način brisanja vsebin ali opustitve uporabnikov se lahko obtoži cenzure in preblokiranja. Ena od alternativnih strategij, ki jih je raziskovalna skupnost do zdaj malo pozornosti prejela, je dejansko nasprotovanje sovraškim vsebinam s protiranimi pripovedi (tj. informiranimi besedilnimi odgovori). V prispevku opisujemo ustvarjanje prvega obsežnega večjezičnega nabora podatkov, ki temelji na strokovnjakih, sovražno-govornih/protiranih parov. Ta nabor podatkov je bil zgrajen s prizadevanji več kot 100 operaterjev iz treh različnih nevladnih organizacij, ki so za to nalogo uporabili svoje usposabljanje in strokovno znanje. Skupaj z zbranimi podatki zagotavljamo tudi dodatne opombe o demografiji strokovnjakov, vrsti sovraštva in odziva ter povečanju podatkov s prevajanjem in parafraziranjem. Na koncu zagotavljamo začetne poskuse za oceno kakovosti naših podatkov.Abstract
In kastoo ay jirto jahaado a an horay u hormarin in lagu siiyo jawaabo ku filan sharciyada iyo siyaasadeeda in laga nebcaado wax ku saabsan jardiinada shabakadda bulshada, iskuullada nacaybka internetku weli waa dhibaato adag. Hadalka nacaybka ee caadiga ah ee la baabbi'iyo waxyaabaha ama joojinta isticmaalaha waxaa lagu qasbi karaa in la xiriiro iyo in la xiriiro. Dhaqdhaqaaqa bedelka ah, kaas oo ilaa waqti ay dareemeen in yar, waa inuu ka hor jeedaa kooxda nacaybka oo ku qoran taariikhda ka hor jeeda (tusaale ahaan jawaabaha qoraalka). Qoraalkan waxaynu ku qoraynaa abuuridda koowaad oo aad u weyn, labada macluumaad oo luuqadood oo kala duduwan, aqoonta ku saleysan labada noocyo oo ah hadalka nacayb/labada nooc oo ka gees ah. Taasinimadan waxaa la dhisay in ka badan 100 qo shaqo oo ka soo baxay saddex 非GO oo kala duduwan, kuwaas oo shaqada ku codsaday waxbarashadooda iyo aqoontooda. Sidoo kale macluumaadka la soo ururiyey waxaynu sidoo kale ka siinaynaa warqado dheeraad ah oo ku saabsan dadka yaqaaniin, nooca nebcaad iyo jawaabta, iyo kordhinta macluumaadka ku saabsan turjumidda iyo baaritaanka. Ugu dambaysta waxaan sameynaa imtixaanka hore si aan u qiimeyno qiimeynta macluumaadkayaga.Abstract
Megjithëse ka një përpjekje të paparë për të ofruar përgjigje të përshtatshme lidhur me ligjet dhe politikat për të urryer përmbajtjen në platformat e medias sociale, trajtimi i urrejtjes në internet është ende një problem i vështirë. Duke trajtuar fjalimin e urrejtjes në mënyrën standard të fshirjes së përmbajtjes apo pezullimit të përdoruesit mund të akuzohet për cenzurë dhe mbibllokim. Një strategji alternative, që ka marrë pak vëmendje deri tani nga komuniteti kërkimor, është në fakt të kundërshtohet përmbajtja e urrejtjes me kundërrrëfime (pra përgjigjet tekstuale të informuara). Në këtë letër, ne përshkruajmë krijimin e grupit të parë të të dhënave të shkallës së madhe, shumëgjuhëse, bazuar në ekspertë të çifteve të urrejtjes-fjalimit/kundërrrëfimit. Ky grup i të dhënave është ndërtuar me përpjekjen e më shumë se 100 operatorëve nga tre OJQ të ndryshëm që zbatuan trainimin dhe ekspertizën e tyre në detyrë. Së bashku me të dhënat e mbledhura ne gjithashtu japim anotacione shtesë rreth ekspertëve demografike, tipit të urrejtjes dhe përgjigjes dhe rritjes së të dhënave nëpërmjet përkthimit dhe parafrazimit. Më në fund, ne ofrojmë eksperimente fillestare për të vlerësuar cilësinë e të dhënave tona.Abstract
Iako postoji neprecedentni napor da pruži odgovarajuće odgovore u smislu zakona i politike za mržnju sadržaja na platformama društvenih medija, rješavanje mržnje na internetu je i dalje težak problem. Uzimanje govora mržnje na standardan način obrisanja sadržaja ili suspenzije korisnika može biti optuženo za cenzuru i prekoračenje. Jedna alternativna strategija, koja je do sada dobila malo pažnje od strane istraživačke zajednice, je da se zapravo suprotstavlja sadržaja mržnje protiv priče (tj. informativne tekstualne odgovore). U ovom papiru opisujemo stvaranje prvih velikih, multijezičkih, stručnih podataka o razgovoru mržnje/protivnih parova. Ova kompleta podataka je izgrađena sa naporima više od 100 operatora od tri različite nevladine organizacije koje su primjenjivale svoju obuku i stručnost na zadatak. Zajedno sa skupljenim podacima takođe pružamo dodatne annotacije o ekspertskim demografijama, vrsti mržnje i odgovora i povećanju podataka kroz prevod i parafrazaciju. Konačno, pružamo početne eksperimente da procenimo kvalitet naših podataka.Abstract
Även om det finns en oöverträffad insats för att ge adekvata svar i form av lagar och policyer för att hata innehåll på sociala medieplattformar, är hanteringen av hat online fortfarande ett svårt problem. Att ta itu med hatpropaganda på det vanliga sättet att radera innehåll eller stänga av användare kan anklagas för censur och överblockering. En alternativ strategi, som hittills har fått lite uppmärksamhet av forskarsamhället, är att faktiskt motsätta sig hatinnehåll med motberättelser (dvs informerade textsvar). I denna uppsats beskriver vi skapandet av de första storskaliga, flerspråkiga, expertbaserade datauppsättningarna av hat-tal/kontraberättande par. Datauppsättningen har byggts med insatser av mer än 100 operatörer från tre olika icke-statliga organisationer som tillämpat sin utbildning och expertis på uppgiften. Tillsammans med de insamlade uppgifterna ger vi även ytterligare kommentarer om expertdemografi, hat och svarstyp samt dataökning genom översättning och omskrivning. Slutligen tillhandahåller vi inledande experiment för att bedöma kvaliteten på våra data.Abstract
Ingawa kuna jitihada zisizoendelea kutoa majibu ya kutosha kwa mujibu wa sheria na sera za kuchukia maudhui kwenye majukwaa ya mitandao ya kijamii, kushughulikia chuki mtandaoni bado ni tatizo gumu. Kufunga hotuba ya chuki kwa njia ya kawaida ya kufutwa maudhui au kusimamishwa kwa mtumiaji anaweza kushitakiwa kwa kufuatiliwa na kuzuia vibaya. Mpango mmoja wa mabadiliko, ambao umekuwa na msimamo mdogo mpaka sasa na jamii ya utafiti, ni kupinga maudhui ya chuki yanayopinga simulizi za kupinga (yaani majibu yanayoelezwa kwa msingi). Katika karatasi hii, tunaelezea kuunda kwa kiwango kikubwa cha kwanza, takwimu za lugha mbalimbali za wataalam zilizoko kwenye lugha ya chuki/ndoa za kupinga simulizi. Taarifa hii imejengwa kwa juhudi za wafanyakazi zaidi ya 100 kutoka mashirika matatu tofauti yaliyotumia mafunzo na utaalam wa kazi hiyo. Pamoja na taarifa zilizokusanywa pia tunatoa taarifa za ziada zinazohusu idadi ya watu wataalamu, aina ya chuki na majibu, na kuongezeka kwa taarifa kupitia tafsiri na upigaji kurasa. Finally, we provide initial experiments to assess the quality of our data.Abstract
எனினும் சமூக ஊடக முறைமைகளில் உள்ளடக்கங்களை வெறுப்பதற்கான விதிகள் மற்றும் கொள்கைகளில் போதுமான பதில் வழங்க முன்னாலும் முயற்சி இருக்கிறது, நிலையான உள்ளடக்கத்தை நீக்குதல் அல்லது பயனர் நிறுத்தல் வழியில் வெறுப்பு பேச்சை சேர்த்தல் மற்றும் மேல் தடுக்கும ஆராய்ச்சி சமூகத்தால் குறைவான கவனத்தை பெற்ற ஒரு மாற்று திட்டம், உண்மையில் வெறுப்பு உள்ளடக்கத்தை எதிர்ப்பதாக இருக்கிறது (அதாவது அறிவிக இந்த காகிதத்தில், நாம் முதல் பெரிய அளவில் உருவாக்கத்தை விவரிக்கிறோம், பல மொழிகள், வெறுப்பு பேச்சு/எதிர்ப்பு சொல்லும் ஜோட இந்த தகவல் அமைப்பு பணிக்கு பயிற்சி மற்றும் பரிசுத்தம் பயன்படுத்தப்பட்ட மூன்று வித்தியாசமான அரசு செயலாளர்களின் முயற்சியா சேகரிக்கப்பட்ட தகவல்களுடன் நாம் மொழிபெயர்ப்பு மற்றும் சொற்றொடர் மூலம் மொழிபெயர்ப்பு மற்றும் சொல்லும் மூலம் கூடுதல் அறிவிப்ப இறுதியில், நாம் முதல் சோதனைகளை வழங்குகிறோம் நம் தரவின் தரவை மதிப்பிட.Abstract
Sosial mediýa platformlarynda maksady ýigrenmek üçin, internet ýigrenligi bilen çykarmak ýeterlik täsirler bolsa-da, kanunlaryň we politikalaryň ýagdaýynda ýeterlik jogaplary täzeden çabalar bar. Ullançylary ýigrenýän sözlerini standart ýüze ýitirmek ýa-da ullanyşyň sözlerini censorsýa we aşa bloklamak üçin peýdalanmasy mümkin. Araştyrmalar tarapyndan şu wagt az üns berilýän başga bir strategiýa, hakykatdanam ýigrenýän maksadyny counter-hekaýatlar bilen garşy etmekdir (meseläm, metin ýaly jogaplary bilen görkezilýän). Bu kagyzda biz ilkinji uly ölçekli, multidilli, uzmançylykly hasaplanjak/taryha çiftlerniň bejerilmesini tassyklaýarys. Bu veri seti üç farklı NGO tarafından 100'den fazla operatör çabaları ile bu göreve eğitimi ve uzmanlıklarını uygulayan üç farklı NGO'dan oluşturulmuş. Toparlanýan maglumatlar bilen birlikte uzmanly demografikler, ýigrenç we jogap hili hakynda daýyp duýdurmalar we terjime we paraphrasing aralygy bilen üýtgedýäris Soňunda, bergimiziň kaliwatyny çykarmak üçin başlangyç deneyleri temin edýäris.Abstract
اگرچہ قانون اور سیاست کے مطابق برابر جواب دینے کے لئے ایک غیر پیش آنے والی کوشش ہے کہ سوسیل میڈیا پٹرومٹ پر موافقت ناپسند کرے، ناپسند آنلاین کے ساتھ ادھر ایک سخت مشکل ہے. منصفات حذف یا کارساز حذف کی استاندارڈ طریقے میں دشمنی بات کا کلام کرنا سنسور اور اوربلک کرنے کے ذریعہ مشغول ہو سکتا ہے. ایک دوسری استراتژی، جو تحقیق کمونٹی کے ذریعہ سے تھوڑی توجه کی گئی ہے، یہ بات ہے کہ یہ مخالف داستان کے ساتھ نفرت کی منصوبت کی مخالفت کرنا ہے (یعنی خبردار تفصیل جواب دینے کا). اس کاغذ میں ہم پہلی بڑی مقدار، متعدد زبان، متخصص صحیفوں کی ڈیٹ سٹ کی پیدائش کررہے ہیں. یہ ڈاٹ سٹ تین مختلف NGOs میں سے 100 سے زیادہ اپراتر کی کوشش کے ساتھ بنایا گیا ہے جو ان کی آموزش اور علم کو کام پر لائق کرتے ہیں. جمع کئے ہوئے ڈاٹے کے ساتھ ہم نے بھی مطابق دموگرافیکس، نفرت اور جواب کی طرح کے بارے میں اضافہ اضافہ کیا ہے اور ڈاٹا اضافہ کرنا ترجمہ اور پارافریزنگ کے ذریعہ سے۔ آخر میں، ہم نے پہلی آزمائش کو اپنے ڈیٹوں کی کیفیت کا امتحان کرنے کے لئے پیش کیا ہے.Abstract
Агарчи қонун ва қонунлар сиёсатида ҳукумат ва мазкур ҳукумат тарқатувчиларни хуш кўрсатиш учун қабул қилинмайдиган ишлар мавжуд бўлса ҳам, online hate ни талаб қилиш мумкин. Name Bir boshqa strategiya, o'rganish jamiyati juda kichkina paydo bo'lgan, aslida o'qituvchilar tarkibini o'zgartirish (balki ma'lum texnologiya javoblari). Bu qogʻozda biz birinchi katta darajada, ko'plab tillar va ekspert-asosiy ma'lumotlar tuzilishini anglatamiz. Bu maʼlumotlar satri shu vazifani bajarish va taʼminlov qiladigan uchta boshqa shaxsiy tarmoq boshqaruvchidan 100 dan ortiq operatorlar bilan yaratildi. Tovulgan maʼlumotlar bilan birlashtirish va tarjima va paraphrasing orqali qoʻshimcha taʼrifi qilamiz. Oxirgi, biz ma'lumotning сифатini qidirish uchun birinchi imtiyozni beramiz.Abstract
Mặc dù có một nỗ lực chưa từng có tiền lệ để đưa ra các phản ứng thích hợp về luật pháp và các chính sách để ghét nội dung trên các nền truyền thông xã hội, nhưng đối phó với hận thù trên mạng vẫn là một vấn đề khó khăn. Việc chống lại ngôn ngữ thù ghét theo cách thông thường của việc xóa nội dung hay tạm dừng người dùng có thể bị buộc tội kiểm duyệt và áp lực. Một chiến lược thay thế, chưa được cộng đồng nghiên cứu chú ý nhiều, là thực sự chống lại nội dung hận thù bằng phản thuật phản gián (tức là phản ứng kết cấu thông tin). Trong tờ giấy này, chúng tôi mô tả sự phát triển của bộ dữ liệu truyền thống, đa dạng, đầy đủ chuyên gia về ghét-nói-lời-cãi. Bộ dữ liệu này được xây dựng nhờ nỗ lực của hơn trăm người từ ba tổ chức phi chính phủ khác nhau đã áp dụng huấn luyện và chuyên môn của họ vào nhiệm vụ này. Cùng với dữ liệu thu thập chúng tôi cung cấp thêm chú thích về cách nội bộ chuyên gia, kiểu căm ghét và phản ứng, và việc gia tăng dữ liệu bằng cách dịch và diễn giải. Cuối cùng, chúng tôi cung cấp thí nghiệm đầu tiên để đánh giá chất lượng dữ liệu.Abstract
虽仇于法政社交媒体台榭之间,供前所未有,而在线仇犹棘也。 以删用户权停之法处仇言,或审过封锁。 至目前为止,论界少所关注者,以反叙事(即知情之文本反应)以非仇也。 本文中,述首大,多言者,盖专家仇言/反叙事对数集之创也。 其数集是在三异非政府100多操作员力构,宜其培训专业知识宜用之。 除收拾之数,给有司口统计数据,仇雠应类及译释义增益诸注。 最后,供初步实验以质数据。- Anthology ID:
- P19-1271
- Volume:
- Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics
- Month:
- July
- Year:
- 2019
- Address:
- Florence, Italy
- Venue:
- ACL
- SIG:
- Publisher:
- Association for Computational Linguistics
- Note:
- Pages:
- 2819–2829
- Language:
- URL:
- https://aclanthology.org/P19-1271
- DOI:
- 10.18653/v1/P19-1271
- Bibkey:
- Cite (ACL):
- Yi-Ling Chung, Elizaveta Kuzmenko, Serra Sinem Tekiroglu, and Marco Guerini. 2019. CONAN-COunter NArratives through Nichesourcing : a Multilingual Dataset of Responses to Fight Online Hate SpeechCONAN - COunter NArratives through Nichesourcing: a Multilingual Dataset of Responses to Fight Online Hate Speech. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pages 2819–2829, Florence, Italy. Association for Computational Linguistics.
- Cite (Informal):
- CONAN-COunter NArratives through Nichesourcing : a Multilingual Dataset of Responses to Fight Online Hate SpeechCONAN - COunter NArratives through Nichesourcing: a Multilingual Dataset of Responses to Fight Online Hate Speech (Chung et al., ACL 2019)
- Copy Citation:
- PDF:
- https://aclanthology.org/P19-1271.pdf
- Video:
- https://vimeo.com/384740828
- Code
- marcoguerini/CONAN
- Data
- CONAN, Hate Speech
- Terminologies:
Export citation
@inproceedings{chung-etal-2019-conan, title = "CONAN-COunter NArratives through Nichesourcing : a Multilingual Dataset of Responses to Fight Online Hate Speech{CONAN} - {CO}unter {NA}rratives through Nichesourcing: a Multilingual Dataset of Responses to Fight Online Hate Speech", author = "Chung, Yi-Ling and Kuzmenko, Elizaveta and Tekiroglu, Serra Sinem and Guerini, Marco", booktitle = "Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics", month = jul, year = "2019", address = "Florence, Italy", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/P19-1271", doi = "10.18653/v1/P19-1271", pages = "2819--2829", }
<?xml version="1.0" encoding="UTF-8"?> <modsCollection xmlns="http://www.loc.gov/mods/v3"> <mods ID="chung-etal-2019-conan"> <titleInfo> <title>CONAN-COunter NArratives through Nichesourcing : a Multilingual Dataset of Responses to Fight Online Hate SpeechCONAN - COunter NArratives through Nichesourcing: a Multilingual Dataset of Responses to Fight Online Hate Speech</title> </titleInfo> <name type="personal"> <namePart type="given">Yi-Ling</namePart> <namePart type="family">Chung</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Elizaveta</namePart> <namePart type="family">Kuzmenko</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Serra</namePart> <namePart type="given">Sinem</namePart> <namePart type="family">Tekiroglu</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Marco</namePart> <namePart type="family">Guerini</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <originInfo> <dateIssued>2019-07</dateIssued> </originInfo> <typeOfResource>text</typeOfResource> <relatedItem type="host"> <titleInfo> <title>Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics</title> </titleInfo> <originInfo> <publisher>Association for Computational Linguistics</publisher> <place> <placeTerm type="text">Florence, Italy</placeTerm> </place> </originInfo> <genre authority="marcgt">conference publication</genre> </relatedItem> <identifier type="citekey">chung-etal-2019-conan</identifier> <identifier type="doi">10.18653/v1/P19-1271</identifier> <location> <url>https://aclanthology.org/P19-1271</url> </location> <part> <date>2019-07</date> <extent unit="page"> <start>2819</start> <end>2829</end> </extent> </part> </mods> </modsCollection>
%0 Conference Proceedings %T CONAN-COunter NArratives through Nichesourcing : a Multilingual Dataset of Responses to Fight Online Hate SpeechCONAN - COunter NArratives through Nichesourcing: a Multilingual Dataset of Responses to Fight Online Hate Speech %A Chung, Yi-Ling %A Kuzmenko, Elizaveta %A Tekiroglu, Serra Sinem %A Guerini, Marco %S Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics %D 2019 %8 July %I Association for Computational Linguistics %C Florence, Italy %F chung-etal-2019-conan %R 10.18653/v1/P19-1271 %U https://aclanthology.org/P19-1271 %U https://doi.org/10.18653/v1/P19-1271 %P 2819-2829
Markdown (Informal)
[CONAN-COunter NArratives through Nichesourcing : a Multilingual Dataset of Responses to Fight Online Hate SpeechCONAN - COunter NArratives through Nichesourcing: a Multilingual Dataset of Responses to Fight Online Hate Speech](https://aclanthology.org/P19-1271) (Chung et al., ACL 2019)
- CONAN-COunter NArratives through Nichesourcing : a Multilingual Dataset of Responses to Fight Online Hate SpeechCONAN - COunter NArratives through Nichesourcing: a Multilingual Dataset of Responses to Fight Online Hate Speech (Chung et al., ACL 2019)
ACL
- Yi-Ling Chung, Elizaveta Kuzmenko, Serra Sinem Tekiroglu, and Marco Guerini. 2019. CONAN-COunter NArratives through Nichesourcing : a Multilingual Dataset of Responses to Fight Online Hate SpeechCONAN - COunter NArratives through Nichesourcing: a Multilingual Dataset of Responses to Fight Online Hate Speech. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pages 2819–2829, Florence, Italy. Association for Computational Linguistics.