Label Propagation-Based Semi-Supervised Learning for Hate Speech Classification Etiket Verspreiding gebaseerde semi- ondersoekte leer vir haat spraak klassifisering መግለጫ التعلم شبه الخاضع للإشراف المستند إلى نشر الملصقات لتصنيف الكلام الذي يحض على الكراهية Etiket Təşkil Üstündə Nefrət Sözləri Sınıflandırması Етикет базирано на размножаване полунадзорно обучение за класификация на речта на омразата লেবেলের বৈশিষ্ট্য- ভিত্তিক সেমি- সাপার্ভিস শিক্ষা ঘৃণা ভাষণের জন্য ཤོག་བྱང་ལ་སྤྲོ་བ་དང་གཞི་རྟེན་ནས་ལྕགས་རིགས་ཅན་གྱི་ཤོག་བྱང་ཞིབ་བྱེད་ཀྱི་ཡོད། Naučenje za klasifikaciju govora mržnje na osnovu propagacije Aprendiment semisupervisat basat en la propagació d'etiquetes per la classificació de l'odi Semi-Supervised Learning založené na šíření etiket pro klasifikaci nenávistné řeči Label Propagation-Based Semi-Supervised Learning for Hade Tale Classification Label Propagation Based Semi-Supervised Learning for Hate Speech Classification Ημι-εποπτευόμενη μάθηση βασισμένη στη διάδοση ετικετών για την ταξινόμηση της ομιλίας μίσους Aprendizaje semisupervisado basado en la propagación de etiquetas para la clasificación de discursos de odio Märgistus Propagatsioonipõhine pooljärelevalvega õppimine vihkamise kõne klassifitseerimiseks یادگیری نصف مراقبت بر پایه تفصیل برچسب برای کلاسیف سخنرانی دشمنی Etiketti Propagaatiopohjainen puolivalvottu oppiminen vihapuheen luokitteluun Apprentissage semi-supervisé basé sur la propagation d'étiquettes pour la classification des discours Iomadú Lipéad Foghlaim Leath-Maoirsithe le haghaidh Aicmiú Cainte Fuath KCharselect unicode block name הלימוד המבוסס על תנועה שמבוסס על חצי-השגיחה לקlassifikaציה של נאום שנאה लेबल प्रोपेगेशन-आधारित अर्ध-पर्यवेक्षित शिक्षा हेट स्पीच वर्गीकरण के लिए Naučenje za klasifikaciju govora mržnje na osnovu propagacije Címke Propagációs Alapú Félig Felügyelt Tanulás a Gyűlölet Beszéd Osztályozásához Տեկտիկի պրոգագացիայի հիմնված կես-վերահսկված ուսումնասիրությունը ատելության խոսքի դասակարգման համար Label Propagation-Based Semi-Supervised Learning for Hate Speech Classification Apprendimento semi-supervisionato basato sulla propagazione dell'etichetta per la classificazione del discorso d'odio ヘイトスピーチ分類のためのラベル伝播ベースの半監督学習 Label ნაწილის პროპაგრაციის ბაზაზე ნაწილის ნაწილის კლასიფიკაცია Жарлық жұмыс сөйлеу классификациясы үшін жарты бақылау негізінде 라벨 전파에 기반한 증오 음성 분류 반감독 학습 Etiketėje grindžiamas pusiau prižiūrimas mokymasis neapykantos kalbos klasifikavimui Научење за класификација на говор на омраза базирано на пропагација വെറുപ്പ് സംസാരം ക്ലാസിഷനിക്കുവേണ്ടി പഠിപ്പിക്കുന്നതിനുള്ള ലേബില് പ്രവചനം അടിസ്ഥാനമാക്കിയ സ Харамсалтай ярианы хэлэлцүүлэхийн тулд хагас хяналттай суралцах Pelajaran Semi-Dipengawasi Berdasarkan Propagasi Label untuk Klasifikasi Cakap Kebencian Tagħlim Semissorveljat Ibbażat fuq il-Propagazzjoni tat-Tikketta għall-Klassifikazzjoni tal-Kellem tal-Mibegħda Label Propagation Based Semi-Supervised Learning voor Hate Speech Classification Merkelappsprettingsbasert semioversikt læring for hatespråk- klassifikasjon Pół-nadzorowane uczenie się oparte na propagacji etykiet dla klasyfikacji mowy nienawiści Aprendizagem semi-supervisionada baseada em propagação de rótulos para classificação de discurso de ódio Învățare semi-supravegheată bazată pe propagare a etichetei pentru clasificarea vorbirii de ură Полунадзорное обучение на основе распространения ярлыков для классификации речи на почве ненависти Name Polnadzorovano učenje na osnovi propagacije za klasifikacijo sovražnega govora Waxbarashada barashada ee nebcaadka Mësimi gjysmë i mbikqyrur për klasifikimin e fjalës së urrejtjes bazuar në propagacionin e etiketës Naučenje pod nadzorom na osnovu propagacije na etiketi za klasifikaciju govora mržnje Etikettspridningsbaserat halvövervakat lärande för klassificering av hattal Label Kuhusu Utagaji wa Kigaidi kinachotumiwa na Kielimu cha Kuhusu Hati வெறுப்பு பேச்சு வகைப்படுத்தலுக்கான விளக்கச்சீட்டு குறிப்பு- அடிப்படையிலான பாதுகாப்பு சேர்க்கப் etiket لیبل پھیلانے-بنیاد نصف-Supervised Learning for Hate Speech Classification Name Truyền thuyết thuyết, giáo dục, giám sát học về ghét ngữ văn 盖标签所传,分类半督学
Ashwin Geet D’Sa, Irina Illina, Dominique Fohr, Dietrich Klakow, Dana Ruiter
Abstract
Research on hate speech classification has received increased attention. In real-life scenarios, a small amount of labeled hate speech data is available to train a reliable classifier. Semi-supervised learning takes advantage of a small amount of labeled data and a large amount of unlabeled data. In this paper, label propagation-based semi-supervised learning is explored for the task of hate speech classification. The quality of labeling the unlabeled set depends on the input representations. In this work, we show that pre-trained representations are label agnostic, and when used with label propagation yield poor results. Neural network-based fine-tuning can be adopted to learn task-specific representations using a small amount of labeled data. We show that fully fine-tuned representations may not always be the best representations for the label propagation and intermediate representations may perform better in a semi-supervised setup.Abstract
Ondersoek oor haatspraat klasifikasie het verhoog aandag ontvang. In regte lewe scenarios is 'n klein hoeveelheid van etiketeerde haat spraak data beskikbaar om 'n betroubare klassifiseerder te trein. Semi- superviseer leer neem voordeel van 'n klein hoeveelheid gemerkte data en 'n groot hoeveelheid ongeabelde data. In hierdie papier word etiket propagasie-gebaseerde semi-superviseerde leer uitgesoek vir die taak van haat spraak klasifikasie. Die kwaliteit van etiketting van die ongeabelde stel afhang van die invoer voorstellings. In hierdie werk, wys ons dat voorafgeleerde voorstellings agnostiese is etiket, en wanneer gebruik word met etiket propagasie, gee arme resultate. Neurale netwerk-gebaseerde fyn-tuning kan aangeneem word om taak-spesifieke voorstellings te leer met 'n klein hoeveelheid etiketeerde data te gebruik. Ons wys dat volledig fyn-gewysigde voorstellings dalk nie altyd die beste voorstellings vir die etiket propagasie en middelste voorstellings kan beter uitvoer in 'n semi-ondersoekte opstelling.Abstract
በጥል ንግግር መግለጫ ላይ ትምህርት እየጨመረ፡፡ እውነተኛይቱ ሕይወት በተሳሳይ፣ የጥል ቃላት ዳታ ታናሽ የሚታመነውን ክፍል ለማስተማር ይችላል፡፡ የተጠበቀው ትምህርት ከታናሹ የጽሑፍ ዳታ እና ካልታወቀ መጠን ትልቅ ዳታ ይጠቅማል፡፡ በዚህ ካላት ውስጥ የጥል ንግግር መግለጫ ለማድረግ የሚደረገውን የድምፅ ትምህርት በሚያሳየው የፖለቲካ ትምህርት ይፈልጋል፡፡ ያልታወቀ ጥሩ በጥያቄ መልዕክቶች ላይ ነው። በዚህ ሥራ አስቀድሞ የተጠቃሚ ተሟጋቾች የኢንተርኔት ማዕከላዊ መሆኑን እናሳያቸዋለን፡፡ Neural network-based fine-tuning can be adopted to learn task-specific representations using a small amount of labeled data. በሙሉ የተጠቃሚ መልዕክቶች ሁልጊዜ የበለጠ የባሕላዊ አካባቢ እና የመካከለኛ መልዕክቶች በተለይ ክፍል የሚሻል እንዲሆን እናሳያቸዋለን፡፡Abstract
حظي البحث عن تصنيف خطاب الكراهية باهتمام متزايد. في سيناريوهات الحياة الواقعية ، يتوفر قدر صغير من بيانات الكلام الذي يحض على الكراهية لتدريب مصنف موثوق. يستفيد التعلم شبه الخاضع للإشراف من كمية صغيرة من البيانات المصنفة وكمية كبيرة من البيانات غير المسماة. في هذه الورقة ، يتم استكشاف التعلم شبه الخاضع للإشراف القائم على النشر لمهمة تصنيف خطاب الكراهية. تعتمد جودة وضع العلامات على المجموعة غير المسماة على تمثيلات الإدخال. في هذا العمل ، نوضح أن التمثيلات المدربة مسبقًا هي حيادية للتسمية ، وعند استخدامها مع انتشار الملصق تسفر عن نتائج سيئة. يمكن اعتماد الضبط الدقيق المستند إلى الشبكة العصبية لتعلم التمثيلات الخاصة بالمهمة باستخدام كمية صغيرة من البيانات المصنفة. نوضح أن التمثيلات المضبوطة تمامًا قد لا تكون دائمًا أفضل تمثيلات لنشر الملصق وقد تؤدي العروض الوسيطة بشكل أفضل في إعداد شبه خاضع للإشراف.Abstract
Nöqsanlıq sözlərinin sıralaması barəsindəki araştırma artırdı. Gerçek həyat senaryoylarında, güvenilir bir klasifikatçı təhsil etmək üçün kiçik nöqsanlı nifrət danışma məlumatları mümkün deyildir. Yarı-gözləyirli öyrənmək küçük etiketli məlumatların və böyük müəyyən edilməmiş məlumatların faydalanır. Bu kağızda, etiketli propagasyon-tabanlı yarı-gözləyirli öyrənmək nifrət sözlərinin klasifikasyonu üçün keşif edilir. Qısqa qovluğunun etiketlənməsinin keyfiyeti giriş göstəricilərinə bağlı. Bu işdə, əvvəlcə təhsil edilmiş göstəricilər agnostik etiketləridir və etiket propagasyonu ilə istifadə ediləndə pis sonuçlar verir. Nöral a ğ-tabanlı fin-tuning işləri işləri müəyyən edilmiş məlumatları öyrənmək üçün qəbul edilə bilər. Biz göstəririk ki, tamamilə düzgün göstərilmiş göstərilmələr etiket propagasyonunun ən yaxşı göstərilmələri və orta göstərilmələri yarı-gözləyirli bir quruluşda daha yaxşı işləyə bilər.Abstract
Изследванията относно класификацията на речта на омразата са получили повишено внимание. В реални сценарии е налично малко количество етикетирани данни за речта на омразата, за да се обучи надежден класификатор. Полунадзорното обучение се възползва от малко количество етикетирани данни и голямо количество неетикетирани данни. В тази статия е изследвано полу-надзорно обучение на базата на размножаване на етикети за задачата за класификация на речта на омразата. Качеството на етикетирането на незабелязания набор зависи от входните изображения. В тази работа показваме, че предварително обучените изображения са агностични на етикета и когато се използват с размножаване на етикета дават лоши резултати. Финно настройване, базирано на невронна мрежа, може да бъде прието, за да се научат специфични за задачата изображения, използвайки малко количество етикетирани данни. Показваме, че напълно фино настроените представяния не винаги могат да бъдат най-добрите представяния за разпространението на етикета, а междинните представяния могат да се представят по-добре в полунадзорна настройка.Abstract
Research on hate speech classification has received increased attention. বাস্তব জীবনের দৃশ্যের মধ্যে একটি বিশ্বস্ত শ্রেণীবিষয়ক প্রশিক্ষণ প্রদান করার জন্য বেশ কিছু লেখা ঘৃণা বাক্যাটার সেমি পর্যবেক্ষিত শিক্ষা শিক্ষা ছোট পরিমাণ লেবেলের তথ্য এবং বিশাল পরিমাণ অলীকৃত তথ্যের সুবিধা প্রদান করে। এই কাগজটিতে প্রচারণা ভিত্তিক সেমি পর্যবেক্ষণকারী শিক্ষা বিশেষ করে ঘৃণা ভাষণ বিশ্লেষণের কাজের জন্য। অল্প লেবেলের মান ইনপুটের প্রতিনিধির উপর নির্ভর করে। এই কাজে আমরা দেখাচ্ছি যে পূর্ব প্রশিক্ষিত প্রতিনিধিরা লেবেল অ্যাঙ্কোস্টিক এবং যখন লেবেল প্রচারণা দিয়ে ব্যবহার করা হয় তখন ত নিউরেল নেটওয়ার্ক ভিত্তিক ভিত্তিক ভিত্তিক সুন্দর টুইনিং গ্রহণ করা যাবে কাজ-নির্দিষ্ট প্রতিনিধিত্ব শিখতে পার আমরা দেখাচ্ছি যে পুরোপুরি সুন্দর প্রতিনিধিত্ব সম্ভবত লেবেল প্রচারণার জন্য সবচেয়ে ভালো প্রতিনিধিত্ব নয় এবং মধ্যপ্রতিনিধিত্বের মধ্যAbstract
ཕྱིར་ཉིད་དགའ་ཕྱོགས་དབྱེ་ཞིབ་དང་བསྟུན་ནས་གནད་དོན་ཞིག་ཡོད། In real-life scenarios, a small amount of labeled hate speech data is available to train a reliable classifier. Semi-supervised learning takes advantage of a small amount of labeled data and a large amount of unlabeled data. ཤོག་བྱང་འདིའི་ནང་དུ་དམིགས་ཡུལ་ལ་ཞིབ་འཇུག་པའི་སྣ་ཚོགས་རྣམས་མཐོང་ནུས་ལྟར་བསམ་བློ་གཏོང་དང་། The quality of labeling the unlabeled set depends on the input representations. འོན་ཀྱང་། ང་ཚོས་བྱ་རིམ་འདིའི་ནང་དུ་སྔོན་གྲངས་སྒྲིག་གི་གསལ་བཤད་པ་ནི་ཤོག་བྱང་ཉེས་བ་ཞིག་ཡིན། Neural network-based fine-tuning can be adopted to learn task-specific representations using a small amount of labeled data. ང་ཚོས་མ་མཐུན་བཟོ་བྱེད་ཡོད་པའི་རྣམ་གྲངས་ཀྱི་ཁ་ཡིག་གི་འཕགས་རིས་གཞན་མིན་ནམ་ཡང་མི་འོང་།Abstract
Istraživanje o klasifikaciji govora mržnje dobilo je povećanu pažnju. U stvarnom životnom scenariju, dostupna je mala količina označenih podataka o govoru mržnje za obuku pouzdanog klasifikatora. Polovično nadzirano učenje koristi mali količin označenih podataka i veliku količinu neopisivanih podataka. U ovom papiru, polu-nadzorno učenje na temelju propagacije, istražuje se za zadatak klasifikacije govora mržnje. kvaliteta označavanja nezabeliranog seta ovisi o predstavljanju ulaza. U ovom poslu pokazujemo da su predobučene predstave agnostične etikete, a kada se koristi sa propagacijom etikete, donose loše rezultate. Neuralna mreža može se usvojiti kako bi naučila specifične predstave na zadatku koristeći malu količinu označenih podataka. Pokazujemo da potpuno ispravni predstavnici ne mogu uvijek biti najbolji predstavnici za propagaciju etiketa i prosječne predstave mogu biti bolji u polu-nadzornom setu.Abstract
La recerca sobre la classificació del discurs d'odi ha rebut més atenció. En els escenaris de la vida real, hi ha una petita quantitat de dades etiquetades de discurs odiosos disponibles per formar un classificador fiable. Semi-supervised learning takes advantage of a small amount of labeled data and a large amount of unlabeled data. En aquest paper, s'explora l'aprenentatge semisupervisat basat en la propagació per la classificació de l'odi. La qualitat d'etiquetar el conjunt sense etiqueta depèn de les representacions d'entrada. En aquesta feina, demostram que les representacions pré-entrenades són etiquetes agnòstiques, i quan s'utilitzen amb etiquetes de propagació tenen resultats pocs bons. Es poden adoptar ajustes a la xarxa neuronal per aprendre representacions específices per a les tasques utilitzant una petita quantitat de dades etiquetades. Mostrem que representacions perfectament ajustades potser no sempre són les millors representacions per a la propagació de l'etiqueta i representacions intermedies poden resultar millor en una configuració semisupervisada.Abstract
Výzkum klasifikace nenávistných řečí získal zvýšenou pozornost. V reálných scénářích je k dispozici malé množství označených dat o nenávistné řeči pro trénink spolehlivého klasifikátoru. Semi-supervised learning využívá malého množství označených dat a velkého množství neoznačených dat. V tomto článku je zkoumáno semi-supervisované učení založené na šíření etiket pro úkol klasifikace nenávistné řeči. Kvalita označení neoznačené sady závisí na vstupních reprezentacích. V této práci ukazujeme, že předškolené reprezentace jsou etiketové agnostické a při použití s šířením etiketů přinášejí špatné výsledky. Neurální síťové jemné ladění lze přijmout pro naučení se specifických reprezentací úloh pomocí malého množství označených dat. Ukazujeme, že plně vyladěné reprezentace nemusí být vždy nejlepšími reprezentacemi pro šíření štítků a meziproduktivní reprezentace mohou fungovat lépe v polovičně dohledovaném nastavení.Abstract
Forskning om hadefuldtale klassificering har fået øget opmærksomhed. I virkelighedens scenarier er der en lille mængde mærkede hadefuldtale data tilgængelige for at uddanne en pålidelig klassificering. Delvist overvåget læring udnytter en lille mængde mærkede data og en stor mængde ikke-mærkede data. I denne artikel undersøges label propagation-baseret semi-supervised learning med henblik på at klassificere hadefulde taler. Kvaliteten af mærkning af det mærkede sæt afhænger af input repræsentationer. I dette arbejde viser vi, at præ-trænede repræsentationer er etiketagnostiske, og når de bruges med etiketformering giver dårlige resultater. Neural netværksbaseret finjustering kan anvendes til at lære opgavespecifikke repræsentationer ved hjælp af en lille mængde mærkede data. Vi viser, at fuldt finjusterede repræsentationer måske ikke altid er de bedste repræsentationer for etikettens udbredelse, og mellemliggende repræsentationer kan fungere bedre i en semi-overvåget opsætning.Abstract
Die Forschung zur Klassifizierung von Hassrede hat mehr Aufmerksamkeit erhalten. In realen Szenarien steht eine kleine Menge beschrifteter Hassrededaten zur Verfügung, um einen zuverlässigen Klassifikator zu trainieren. Semi-Supervised Learning nutzt eine geringe Menge an markierten Daten und eine große Menge an nicht markierten Daten. In dieser Arbeit wird das Label Propagation Based Semi-Supervised Learning für die Aufgabe der Hate Speech Klassifizierung untersucht. Die Qualität der Beschriftung der nicht beschrifteten Menge hängt von den Eingabedarstellungen ab. In dieser Arbeit zeigen wir, dass vortrainierte Repräsentationen labelagnostisch sind und bei Verwendung mit Label Propagation schlechte Ergebnisse liefern. Neuronale netzwerkbasierte Feinabstimmungen können verwendet werden, um aufgabenspezifische Darstellungen mit einer kleinen Menge beschrifteter Daten zu erlernen. Wir zeigen, dass vollständig abgestimmte Darstellungen möglicherweise nicht immer die besten Darstellungen für die Etikettenverbreitung sind und zwischengeschaltete Darstellungen in einem semi-überwachten Setup möglicherweise besser funktionieren.Abstract
Η έρευνα για την ταξινόμηση της ομιλίας μίσους έχει λάβει αυξημένη προσοχή. Σε σενάρια πραγματικής ζωής, μια μικρή ποσότητα επισημασμένων δεδομένων ομιλίας μίσους είναι διαθέσιμη για να εκπαιδεύσει έναν αξιόπιστο ταξινομητή. Η ημι-εποπτευόμενη μάθηση εκμεταλλεύεται μια μικρή ποσότητα δεδομένων με ετικέτα και μια μεγάλη ποσότητα δεδομένων χωρίς ετικέτα. Στην παρούσα εργασία, διερευνάται η ημι-εποπτευόμενη μάθηση βασισμένη στη διάδοση ετικετών για το έργο της ταξινόμησης της ομιλίας μίσους. Η ποιότητα της επισήμανσης του συνόλου χωρίς ετικέτα εξαρτάται από τις αναπαραστάσεις εισόδου. Σε αυτή την εργασία, καταδεικνύουμε ότι οι προ-εκπαιδευμένες αναπαραστάσεις είναι αγνωστικές ετικέτες και όταν χρησιμοποιούνται με τη διάδοση ετικετών αποδίδουν κακά αποτελέσματα. Ο συντονισμός με βάση το νευρωνικό δίκτυο μπορεί να υιοθετηθεί για να μάθετε αναπαραστάσεις συγκεκριμένων εργασιών χρησιμοποιώντας μια μικρή ποσότητα δεδομένων με ετικέτα. Δείχνουμε ότι οι πλήρως συντονισμένες αναπαραστάσεις μπορεί να μην είναι πάντα οι καλύτερες αναπαραστάσεις για τη διάδοση της ετικέτας και οι ενδιάμεσες αναπαραστάσεις μπορεί να αποδίδουν καλύτερα σε μια ημι-εποπτική ρύθμιση.Abstract
La investigación sobre la clasificación del discurso de odio ha recibido cada vez más atención En escenarios de la vida real, se dispone de una pequeña cantidad de datos de incitación al odio etiquetados para entrenar a un clasificador confiable. El aprendizaje semisupervisado aprovecha una pequeña cantidad de datos etiquetados y una gran cantidad de datos sin etiqueta. En este artículo, se explora el aprendizaje semisupervisado basado en la propagación de etiquetas para la tarea de clasificar el discurso de odio. La calidad del etiquetado del conjunto sin etiqueta depende de las representaciones de entrada. En este trabajo, mostramos que las representaciones previamente entrenadas son agnósticas de la etiqueta y, cuando se usan con la propagación de etiquetas, producen malos resultados. Se puede adoptar el ajuste fino basado en redes neuronales para aprender representaciones específicas de tareas utilizando una pequeña cantidad de datos etiquetados. Demostramos que las representaciones completamente ajustadas pueden no ser siempre las mejores representaciones para la propagación de etiquetas y las representaciones intermedias pueden funcionar mejor en una configuración semi-supervisada.Abstract
Vihakõne klassifitseerimise uuringud on saanud suuremat tähelepanu. Reaalsetes stsenaariumides on usaldusväärse klassifitseerija koolitamiseks kättesaadav väike hulk märgistatud vihakõne andmeid. Pooljuhendatud õpe kasutab ära väikest hulka märgistatud andmeid ja suurt hulka märgistamata andmeid. Käesolevas töös uuritakse vihkamise kõne klassifitseerimise ülesandeks etiketi levitamisel põhinevat pooljuhitatud õppimist. Märgistamata komplekti märgistamise kvaliteet sõltub sisendesitustest. Selles töös näitame, et eelnevalt koolitatud esindused on etiketi agnostilised ja kui neid kasutatakse etiketi paljundamisega, annavad need halvad tulemused. Närvivõrgupõhist peenhäälestust saab kasutada ülesandepõhiste esituste õppimiseks, kasutades väikest hulka märgistatud andmeid. Me näitame, et täielikult häälestatud esitused ei pruugi alati olla etiketi levitamise parimad esitused ja vahepealsed esitused võivad olla paremad pooljärelevalvega seadistuses.Abstract
تحقیقات محرمانه سخنرانی متنفر توجه افزایش یافته است. در صحنههای زندگی واقعی، یک مقدار کوچک از اطلاعات سخنرانی متنفری که نامیده میشود برای آموزش یک راهنمایی قابل اطمینان است. یادگیری نصف نظارت از مقدار کوچک دادههای نقاشی و مقدار زیادی از دادههای نامزدی استفاده میکند. در این کاغذ، یادگیری نصف تحت نظارت بر اساس پراژدهای برچسب برای کارهای مختلف سخنرانی متنفر تحقیق میشود. کیفیت برچسب کردن مجموعه نامزدی بستگی به نمایش ورودی است. در این کار، نشان می دهیم که نمایش های پیش آموزش آموزش یادآوری هستند، و زمانی که استفاده می شود با پراژدهای نقاشی، نتیجه های بدی می دهد. با استفاده از مقدار اندکی از دادههای برچسبشده، نمایشهای ویژهای برای یاد گرفتن کارها میتواند از شبکههای عصبی استفاده کند. ما نشان میدهیم که نمایشهای کاملاً درستشده ممکن نیست که همیشه بهترین نمایشهای پراژدهای نقاشی باشند و نمایشهای بینالمللی ممکن است بهتر در یک تنظیم نیمهبررسی انجام دهند.Abstract
Vihanpuheen luokitteluun liittyvä tutkimus on saanut yhä enemmän huomiota. Todellisissa skenaarioissa on saatavilla pieni määrä merkittyä vihapuhedataa luotettavan luokittelijan kouluttamiseksi. Puolijuhdettu oppiminen hyödyntää pienen määrän merkittyä dataa ja suuren määrän merkitsemätöntä dataa. Tässä työssä tutkitaan etikettien levittämiseen perustuvaa puoliohjattua oppimista vihapuheen luokitteluun. Merkittämättömän joukon merkinnän laatu riippuu syötteen esittämistä. Tässä työssä osoitetaan, että esikoulutetut representaatiot ovat etikettiagnostisia, ja kun niitä käytetään etikettien leviämisen kanssa, ne tuottavat huonoja tuloksia. Neuroverkkoon perustuvaa hienosäätöä voidaan käyttää tehtäväkohtaisten esitysten oppimiseen pienellä määrällä merkittyä dataa. Osoitamme, että täysin hienosääteiset esitykset eivät välttämättä aina ole parhaita esityksiä etiketin levittämiselle ja välimuotoiset esitykset voivat toimia paremmin puolivalvotussa asennuksessa.Abstract
La recherche sur la classification des discours haineux a reçu une attention accrue. Dans des scénarios réels, une petite quantité de données étiquetées sur les discours haineux est disponible pour former un classificateur fiable. L'apprentissage semi-supervisé tire parti d'une petite quantité de données étiquetées et d'une grande quantité de données non étiquetées. Dans cet article, l'apprentissage semi-supervisé basé sur la propagation d'étiquettes est exploré pour la tâche de classification des discours haineux. La qualité de l'étiquetage de l'ensemble non étiqueté dépend des représentations en entrée. Dans ce travail, nous montrons que les représentations pré-entraînées sont indépendantes des étiquettes et que, lorsqu'elles sont utilisées avec la propagation d'étiquettes, elles donnent de mauvais résultats. Le réglage fin basé sur un réseau de neurones peut être adopté pour apprendre des représentations spécifiques à une tâche à l'aide d'une petite quantité de données étiquetées. Nous montrons que les représentations entièrement affinées ne sont pas toujours les meilleures représentations pour la propagation des étiquettes et que les représentations intermédiaires peuvent être plus performantes dans une configuration semi-supervisée.Abstract
Tá aird mhéadaithe tugtha ar thaighde ar rangú fuathchaint. I gcásanna fíor-saoil, tá méid beag de shonraí fuathchainte lipéadaithe ar fáil chun aicmitheoir iontaofa a oiliúint. Baineann foghlaim leathmhaoirseachta leas as méid beag sonraí lipéadaithe agus as líon mór sonraí neamhlipéadaithe. Sa pháipéar seo, déantar foghlaim leath-mhaoirseachta bunaithe ar iomadú lipéad a iniúchadh don tasc a bhaineann le haicmiú fuathchaint. Braitheann cáilíocht lipéadaithe an tacair neamhlipéadaithe ar na huiríll ionchuir. San obair seo, léirímid go bhfuil léirithe réamh-oilte agnostic lipéad, agus nuair a úsáidtear iad le iomadú lipéad tugann siad torthaí lag. Is féidir mionchoigeartú líonra néar-bhunaithe a ghlacadh chun léirithe tasc-shonracha a fhoghlaim agus úsáid á baint as méid beag sonraí lipéadaithe. Léirímid go mb’fhéidir nach iad léirithe atá go hiomlán mionchoigeartaithe na huiríll is fearr i gcónaí don iomadú lipéad agus d’fhéadfadh go n-éireodh níos fearr le huiríll idirmheánacha i socrú leathmhaoirsithe.Abstract
Research on classified magana na ƙi sun ƙara aikin. In ƙayyade halin rãyuwa, there is an ƙunci kaɗan da aka rubuta data na hoton ƙarya da aka yi rubũtãwa dõmin ya sanar da wani mai fassarwa da ake amintar da. Shirin da aka tsare shi na amfani da nau'in jama'a da aka rubũta shi da yawan data na girma wanda ba'a sani ba. A cikin wannan takarda, aka buɗe wa wa aikin fassarar magana na ƙetare. Tsarin alama da ba'a yi amfani ba, yana dõgara ga shaidar inputan. Daga wannan aikin, Munã nũna wa masu tsarin da aka yi wa zaman aikin su shine label agnostic, kuma idan an yi amfani da shi da alama za'a sami fassarar matalauci. Ki iya amfani da gwargwadon tsarin aiki-ƙayyade neural don a iya amfani da gwargwadon da aka rubuta. Tuna nũna cewa, misãlai da aka cika kyakkyawan su ba su zama mafi kyãwo ga sifarwa na label kuma masu tsakanin tsakanin zai yi mafiya alhẽri a cikin tsarin da aka yi tsaro.Abstract
Research on hate speech classification has received increased attention. בתרחישים של חיים אמיתיים, כמות קטנה של נתוני נאום שנאה מסומנים זמינים לאימון מסווג אמין. הלימודים ששומרים על חצי מנצלים כמות קטנה של נתונים מסומנים וכמות גדולה של נתונים לא מסומנים. בעיתון הזה, הלימוד המבוסס על התרבות חצי-מפקח נחקר למשימה של שיעור נאום שנאה. איכות התווית של הקבוצה ללא סימנים תלויה ביצועי הכניסה. בעבודה הזאת, אנו מראים שהמייצגים מאומנים מראש הם תוויות אגנוסטיות, וכאשר משתמשים עם תוויות התרבות יוצרים תוצאות גרועות. ניתן לאמץ התאמה עצבית מבוססת ברשת כדי ללמוד מייצגים מסויימים למשימות באמצעות כמות קטנה של נתונים מסויימים. אנו מראים שהמייצגים מיוחדים לחלוטין אולי לא תמיד יהיו הייצגים הטובים ביותר עבור ההתפתחות של התווית והמייצגים הביניים יכולים להפעיל טוב יותר במערכת חצי-מפקחת.Abstract
हेट स्पीच वर्गीकरण पर शोध ने अधिक ध्यान दिया है। वास्तविक जीवन के परिदृश्यों में, एक विश्वसनीय क्लासिफायर को प्रशिक्षित करने के लिए लेबल किए गए हेट स्पीच डेटा की एक छोटी राशि उपलब्ध है। अर्ध-पर्यवेक्षित शिक्षा लेबल किए गए डेटा की एक छोटी राशि और बड़ी मात्रा में लेबल रहित डेटा का लाभ उठाती है। इस पेपर में, लेबल प्रोपेगेशन-आधारित अर्ध-पर्यवेक्षित सीखने को हेट स्पीच वर्गीकरण के कार्य के लिए खोजा जाता है। लेबल रहित सेट को लेबल करने की गुणवत्ता इनपुट अभ्यावेदन पर निर्भर करती है। इस काम में, हम दिखाते हैं कि पूर्व-प्रशिक्षित अभ्यावेदन लेबल अज्ञेयवादी हैं, और जब लेबल प्रसार के साथ उपयोग किया जाता है तो खराब परिणाम मिलते हैं। न्यूरल नेटवर्क-आधारित फाइन-ट्यूनिंग को लेबल किए गए डेटा की एक छोटी राशि का उपयोग करके कार्य-विशिष्ट प्रतिनिधित्व सीखने के लिए अपनाया जा सकता है। हम दिखाते हैं कि पूरी तरह से ठीक-ठाक प्रतिनिधित्व हमेशा लेबल प्रचार के लिए सबसे अच्छा प्रतिनिधित्व नहीं हो सकता है और मध्यवर्ती प्रतिनिधित्व एक अर्ध-पर्यवेक्षित सेटअप में बेहतर प्रदर्शन कर सकते हैं।Abstract
Istraživanje o klasifikaciji govora mržnje dobilo je povećanu pažnju. U scenarijima stvarnog života dostupna je mala količina označenih podataka o govoru mržnje za obuku pouzdanog klasifikatora. Polovično nadzirano učenje koristi mali količin označenih podataka i veliku količinu neopisivanih podataka. U ovom papiru se istražuje učenje pod nadzorom na temelju propagacije za zadatak klasifikacije govora mržnje. kvaliteta označavanja nezabeliranog seta ovisi o predstavljanju ulaza. U ovom poslu pokazujemo da su predobučene predstave agnostične etikete, a kada se koristi s etiketom propagacije donose loše rezultate. Neuralna mreža može se usvojiti kako bi naučili predstave specifičnih zadataka koristeći malu količinu označenih podataka. Pokazujemo da potpuno ispravni predstavnici ne mogu uvijek biti najbolji predstavnici za propagaciju etikete i prosječne predstave mogu biti bolji u polu-nadzornoj ustanovi.Abstract
A gyűlöletbeszéd osztályozásával kapcsolatos kutatások nagyobb figyelmet kaptak. A valós forgatókönyvekben kis mennyiségű gyűlöletbeszéd adat áll rendelkezésre egy megbízható osztályozó képzésére. A félig felügyelt tanulás kis mennyiségű címkézett adatot és nagy mennyiségű címke nélküli adatot használ. Ebben a tanulmányban a gyűlöletbeszéd osztályozásának feladata céljából címketerjesztési alapú, félig felügyelt tanulást vizsgálunk. A címke nélküli készlet címkézésének minősége a bemeneti ábrázolásoktól függ. Ebben a munkában megmutatjuk, hogy az előkészített reprezentációk címke agnosztikusak, és ha címke szaporítással használják, rossz eredményeket eredményeznek. Neurális hálózati alapú finomhangolás alkalmazható a feladatspecifikus reprezentációk megtanulására kis mennyiségű címkézett adat segítségével. Megmutatjuk, hogy a teljesen finomhangolt reprezentációk nem mindig a legjobb reprezentációk a címke terjesztéséhez, és a köztes reprezentációk jobban teljesíthetnek egy félig felügyelt beállításban.Abstract
ատելության խոսքի դասակարգման հետազոտությունները ավելի ուշադրություն են դարձրել: Իրական կյանքի սցենարներում մի փոքր քանակ ատելության խոսքի տվյալներ հասանելի են վստահելի դասակարգիչ վարժեցնելու համար: Կամի-վերահսկվող ուսումնասիրությունը օգտագործում է մի փոքր քանակությամբ պիտակուցված տվյալներ և մի մեծ քանակությամբ անպիտակուցված տվյալներ: Այս թղթի մեջ պիտակները բազմազանությամբ հիմնված կիսավերահսկված ուսումնասիրություն ուսումնասիրում են ատելության խոսքի դասակարգման խնդրի համար: Տեղադրված համակարգի պիտակավորման որակը կախված է ներմուծի ներկայացումներից: Այս աշխատանքի ընթացքում մենք ցույց ենք տալիս, որ նախապատրաստված ներկայացումները ագնոստիկ են, և երբ օգտագործվում են պիտակների տարածման հետ, վատ արդյունքներ են ստանում: Neural network-based fine-tuning can be adopted to learn task-specific representations using a small amount of labeled data. We show that fully fine-tuned representations may not always be the best representations for the label propagation and intermediate representations may perform better in a semi-supervised setup.Abstract
Penelitian tentang klasifikasi pidato kebencian telah menerima perhatian yang meningkat. Dalam skenario kehidupan nyata, jumlah kecil dari data pidato kebencian yang ditandai tersedia untuk melatih klassifikasi yang dapat dipercaya. Belajar semi-supervised mengambil keuntungan dari jumlah kecil data yang ditabel dan jumlah besar data yang tidak ditabel. Dalam kertas ini, pelajaran semi-supervised berdasarkan label propagasi diuji untuk tugas klasifikasi pidato kebencian. Kualitas label set tanpa label tergantung pada representation input. Dalam pekerjaan ini, kami menunjukkan bahwa persembahan pra-dilatih adalah label agnostik, dan ketika digunakan dengan label propagasi memberikan hasil buruk. Penyesuaian berasaskan jaringan saraf dapat diadopsi untuk belajar representation spesifik tugas menggunakan jumlah kecil data yang ditabel. Kami menunjukkan bahwa persembahan yang sempurna mungkin tidak selalu merupakan persembahan terbaik untuk propagasi label dan persembahan intermedium mungkin berhasil lebih baik dalam setup semi-mengawasi.Abstract
La ricerca sulla classificazione dei discorsi d'odio ha ricevuto maggiore attenzione. Negli scenari di vita reale, una piccola quantità di dati etichettati sull'incitamento all'odio è disponibile per formare un classificatore affidabile. L'apprendimento semi-supervisionato sfrutta una piccola quantità di dati etichettati e una grande quantità di dati non etichettati. In questo articolo, l'apprendimento semi-supervisionato basato sulla propagazione delle etichette è esplorato per il compito di classificazione del discorso d'odio. La qualità dell'etichettatura del set non etichettato dipende dalle rappresentazioni di input. In questo lavoro, mostriamo che le rappresentazioni pre-addestrate sono agnostiche dell'etichetta, e quando utilizzate con la propagazione dell'etichetta producono risultati scarsi. La messa a punto neurale basata sulla rete può essere adottata per imparare rappresentazioni specifiche delle attività utilizzando una piccola quantità di dati etichettati. Mostriamo che le rappresentazioni completamente sintonizzate potrebbero non essere sempre le migliori rappresentazioni per la propagazione dell'etichetta e le rappresentazioni intermedie potrebbero funzionare meglio in un setup semi-supervisionato.Abstract
ヘイトスピーチの分類に関する研究はますます注目されている。実際のシナリオでは、少量のラベル付けされたヘイトスピーチデータが利用可能であり、信頼できる分類子を訓練する。半監督型学習は、少量のラベル付けされたデータと大量のラベル付けされていないデータを利用します。本稿では、ヘイトスピーチ分類の課題について、ラベル伝播ベースの半監督学習を探求する。ラベル付けされていないセットのラベル付けの品質は、入力表現に依存します。この研究では、事前に訓練された表現はラベル不可知論的であり、ラベル伝播と併用すると不十分な結果をもたらすことが示されている。ニューラルネットワークベースの微調整を採用して、少量のラベル付けされたデータを使用してタスク固有の表現を学習することができる。完全に微調整された表現は、ラベルの伝播にとって常に最良の表現であるとは限らず、中間表現は、半監督設定でより良いパフォーマンスを発揮する可能性があることを示しています。Abstract
Genjer Slackfree politenessoffpolite"), and when there is a change ("assertive Genjer-genjer string" in "context_BAR_stringNew Nang barêng-barêng iki, kita ngomong nik wektu preransframentasi layar mênêmêr, karo ngono nggawe barang kelompok barang nggawe barang kelompok. checkbox Awak dhéwé ngomong nik kabèh-melokakno sing bisa nguasai mèh dumadhi iki dadi sing apik dhéwé nggawe aturan tambah karo tambah sing bisa mlebu tambah apik dhéwé.Abstract
კლასიფიკაცია მპატის საუკეთესო საუკეთესო საუკეთესო საუკეთესო საუკეთესო დაახლოებით. რეალური ცხოვრების სინარიოში, მარტივი მარტივი სიტყვების მონაცემები შესაძლებელია დარწმუნებელი კლასიფიკაცია. ნახევარჯერი მონაცემები იყენებს პატარა მარტივი მონაცემების და დიდი მარტივი მონაცემების გამოყენება. ამ წიგნის შესახებ, პროგადაციის ნახევად ნახევარჯვნილი სწავლება განსხვავებულია მპატის სიტყვის კლასიფიკაციის დასახებ. შენიშვნელოვანი კონფიგურაციის უფრო ღირებულობა დაახლოდება შესახებ შენიშვნელოვანების გამოსახულებაზე. ამ სამუშაოში ჩვენ ჩვენ ჩვენ ჩვენ აჩვენებთ, რომ პრეტრანციები არიან ადნოსტიული, და როდესაც ჩვენ გამოყენებულია მარტივი პროგადაციის შედეგებით. ნეიროლური ქსელის დაფართებული კონფიგურაციის გამოყენება შესაძლებელია დავისწავლა, რომელიც აღნიშნული ცოტა მონაცემების გამოყენება. ჩვენ ჩვენ აჩვენებთ, რომ საუკეთესოდ განსხვავებული გამოსახულებები არ ყოველთვის უკეთესო გამოსახულებების გამოსახულებების და საშუალო გამოსახულებების გამოსახულება შეიძლება უფროAbstract
Жұмыс сөйлеу үшін зерттеу көтерілді. Шынымен өмір сценариясында, сенімді классификаторын оқыту үшін жарлық жарлық сөйлеу деректері бар. Жарты бақылау үйренімі жарлық мәліметтердің кішкентай мәліметін және үлкен мәліметтердің ұзындығын пайдалану мүмкіндік береді. Бұл қағазында, жарлық пропагациясы негіздеген жарты бақылау үйренімі жұмыс сөйлеу классификациясының тапсырмасына зерттеді. Белгілмеген жиының жарлығының сапасы келтірілгендеріне тәуелді. Бұл жұмыс ішінде біз алдын- ала оқылған кескіндердің агностикалық белгілерін көрсетедік, және белгілердің пропагациясы керек нәтижелерін көрсетеді. Нейрондық желінің негіздеген дұрыс баптауы тапсырмаларды келтіру үшін кейбір жарлық деректерді қолдану үшін қолданылады. Біз жарлық пропагациясының ең жақсы көрсеткіштері және орташа көрсеткіштері жарты қарау баптауында жақсы болуы мүмкін емес дегенді көрсетедік.Abstract
원한 언어의 분류에 대한 연구가 갈수록 많은 관심을 받고 있다.현실 생활에서 소량의 표기된 원한 음성 데이터는 믿을 만한 분류기를 훈련하는 데 쓰일 수 있다.반감독학습은 소량의 표기 데이터와 대량의 미표기 데이터를 이용했다.본고는 라벨 전파를 바탕으로 하는 반감독 학습이 증오 음성 분류에서의 응용을 탐구했다.태그 미태그 세트의 품질은 입력 표현에 따라 달라집니다.이 작업에서 우리는 미리 훈련한 표시는 라벨을 알 수 없고 라벨 전파와 함께 사용할 때 결과가 매우 나쁘다는 것을 나타냈다.신경 네트워크를 바탕으로 하는 마이크로스피커는 소량의 표기 데이터를 통해 특정한 임무의 표시를 배울 수 있다.우리는 완전히 미세한 표시가 항상 라벨이 전파하는 가장 좋은 표시가 아니라 중간 표시가 반감독 설정에서 더 잘 나타날 수 있음을 나타낸다.Abstract
Daugiau dėmesio skiriama neapykantos kalbos klasifikavimo moksliniams tyrimams. Realaus gyvenimo scenarijais nedidelis kiekis pažymėtų neapykantos kalbos duomenų yra prieinamas patikimam klasifikatoriui treniruoti. Pusės prižiūrimas mokymasis naudojasi nedideliu kiekiu paženklintų duomenų ir dideliu kiekiu paženklintų duomenų. Šiame dokumente tiriamas pusiau prižiūrimas mokymasis, pagrįstas etiketėmis dauginimu, siekiant klasifikuoti neapykantos kalbą. The quality of labeling the unlabeled set depends on the input representations. Šiame darbe parodomi, kad iš anksto apmokytos reprezentacijos yra agnostinės etiketės, o naudojant etiketę dauginimosi rezultatai yra prasti. Naudojant nedidelį kiekį pažymėtų duomenų, gali būti priimtas neurologinis tinklu pagrįstas patobulinimas, siekiant išsiaiškinti konkrečias užduotis. Mes parodome, kad visiškai tikslūs vaizdai ne visada gali būti geriausi vaizdai etiketės dauginimui, o tarpiniai vaizdai gali geriau veikti puspriežiūros sistemoje.Abstract
Research on hate speech classification has received increased attention. Во реалните сценарија, мала количина обележани податоци за говор на омраза се достапни за обука на доверлив класификатор. Половина надгледувано учење искористува мала количина обележани податоци и голема количина необележани податоци. Во овој весник, полунадгледуваното учење базирано на пропагација е истражувано за задачата на класификацијата на говорот на омраза. Квалитетот на означувањето на наборот без означување зависи од внесните претставувања. Во оваа работа покажуваме дека предобучените претставувања се означени со агностика, а кога се користат со пропагација на означените резултати се лоши. Може да се усвои финетизирање на неуралната мрежа за да се научат специфични претставувања за задачите користејќи мала количина обележани податоци. Ние покажуваме дека целосно финетизираните претставувања можеби не секогаш се најдобрите претставувања за пропагацијата на етикетите, а меѓувремените претставувања можат да бидат подобри во полунадгледувано поставување.Abstract
വെറുപ്പുള്ള വാക്കുകള് ക്ലാസ്ഫിക്ഷനുമായി ഗവേഷണം കൂടുതല് ശ്രദ്ധ കിട്ടി. യഥാര്ത്ഥ ജീവിതത്തില് വിശ്വസിക്കുന്ന ഒരു ക്ലാസ്ഫിഫറിനെ പരിശീലിപ്പിക്കാന് ഒരു ചെറിയ വെറുപ്പ് വാക്ക് സെമി- സൂക്ഷിച്ചുകൊണ്ടിരിക്കുന്ന വിദ്യാഭ്യാസത്തിന്റെ ചെറിയ വിവരങ്ങളും വലിയ വിവരങ്ങളും ഉപയോഗിക്കുന്നു. ഈ പത്രത്തില് വെറുപ്പ് സംസാരിക്കാനുള്ള വിദ്വേഷത്തിന്റെ ജോലിയ്ക്ക് വേണ്ടി ലേബ്റ്റ് പ്രോപ്പഷന് അടിസ അടയാളപ്പെടാത്ത സെറ്റിന്റെ ലേബിള് ചെയ്യുന്നതിന്റെ ഗുണവും ഇന്പുട്ടിന്റെ പ്രതിനിധികളില് ആശ ഈ ജോലിയില്, പരിശീലന പ്രതിനിധികള് ലേബറ്റ് ആഗ്നോസ്റ്റിക്ക് ആണെന്ന് ഞങ്ങള് കാണിക്കുന്നു. ലേബില് പ്രകടമാക്കുമ് ചെറിയ വിവരങ്ങള് ഉപയോഗിച്ച് ജോലി- പ്രത്യേക പ്രതിനിധികള് പഠിക്കാന് നെയൂറല് നെറ്റര് നെറ്റോവര്ക്ക് അടിസ്ഥാ നമ്മള് കാണിക്കുന്നത് പൂര്ണ്ണമായും നല്ല പ്രതിനിധികള് എപ്പോഴും ലേബിന്റെ പ്രോഗ്രാപ്ഷന് പ്രഖ്യാപിക്കുന്നതിന്റെ ഏറ്റവും നല്ല പAbstract
Харамсалтай ярианы хэлэлцээний судалгаагаар анхаарлыг нэмэгдүүлсэн. Үнэндээ жинхэнэ амьдралын хувилбарт, итгэлтэй хувилбарыг суралцах хэрэгтэй жижиг хэмжээний үзэн ядуурлын өгөгдлийн мэдээллүүд байдаг. Хагас дамжуулагдсан суралцах нь жижиг хэмжээний тэмдэглэгдсэн өгөгдлийн талаар ашигладаг. Энэ цаасан дээр хагас дамжуулагч суралцах суралцах нь үзэн ядуурлын илтгэлийн хуваалцааны ажлыг судалж байна. Шинэ хэлбэргүй хэлбэрийн жагсаалтын чанар нь орнуудын үзүүлэлттэй хамааралтай. Энэ ажлын хувьд бид урьд сургалтын үзүүлэлт агностик гэдгийг харуулж байна. Хэрэв тэмдэглэгддэг нь ядуу үр дүнг өгдөг. Шинэ мэдрэлийн сүлжээнд бага хэмжээний тэмдэглэгдсэн өгөгдлийг ашиглаж ажлын тодорхойлолтыг суралцах боломжтой. Бид бүрэн тодорхойлогдсон загварууд үргэлж хамгийн сайн загварууд болох боломжгүй гэдгийг харуулж байна.Abstract
Penelitian tentang klasifikasi ucapan kebencian telah menerima perhatian meningkat. Dalam skenario kehidupan sebenar, jumlah kecil data ucapan kebencian yang ditabel tersedia untuk melatih pengelasah yang boleh dipercayai. Pembelajaran semi-mengawasi mengambil keuntungan dari sejumlah kecil data yang ditabel dan sejumlah besar data yang tidak ditabel. Dalam kertas ini, pembelajaran setengah-mengawasi berdasarkan label pembelajaran dikeksplorasi untuk tugas klasifikasi ucapan kebencian. Kualiti label set tanpa label bergantung pada perwakilan input. Dalam kerja ini, kami menunjukkan bahawa persembahan yang dilatih-dilatih adalah label agnostik, dan apabila digunakan dengan pelebaran label, hasil yang buruk. Neural network-based fine-tuning can be adopted to learn task-specific representations using a small amount of labeled data. Kami menunjukkan bahawa perwakilan yang sempurna mungkin tidak sentiasa merupakan perwakilan terbaik untuk penyebaran label dan perwakilan sementara mungkin berjalan lebih baik dalam seting setengah-mengawasi.Abstract
Ir-riċerka dwar il-klassifikazzjoni tad-diskors tal-mibegħda rċeviet aktar attenzjoni. F’xenarji reali, ammont żgħir ta’ dejta bit-tikketta tad-diskors ta’ mibegħda huwa disponibbli biex jitħarreġ klassifikatur affidabbli. It-tagħlim semisuperviż jieħu vantaġġ minn ammont żgħir ta’ dejta ttikkettata u ammont kbir ta’ dejta mhux ittikkettata. F’dan id-dokument, it-tagħlim semisuperviż ibbażat fuq it-tikketta tal-propagazzjoni huwa esplorat għall-kompitu tal-klassifikazzjoni tad-diskors tal-mibegħda. Il-kwalità tat-tikkettar tas-sett mhux ittikkettat tiddependi fuq ir-rappreżentazzjonijiet tal-input. F’dan ix-xogħol, nuru li rappreżentazzjonijiet imħarrġa minn qabel huma t-tikketta agnostika, u meta jintużaw ma’ tikketta ta’ propagazzjoni jirriżultaw f’riżultati ħżiena. L-a ġġustament fin-netwerk newrali jista’ jiġi adottat biex jitgħallmu rappreżentazzjonijiet speċifiċi għall-kompiti bl-użu ta’ ammont żgħir ta’ dejta ttikkettata. Aħna nuru li rappreżentazzjonijiet irfinati għal kollox jistgħu mhux dejjem ikunu l-a ħjar rappreżentazzjonijiet għall-propagazzjoni tat-tikketta u rappreżentazzjonijiet intermedji jistgħu jwettqu aħjar f’struttura semisuperviża.Abstract
Onderzoek naar hate speech classificatie heeft meer aandacht gekregen. In real-life scenario's is een kleine hoeveelheid gelabelde haatspraakgegevens beschikbaar om een betrouwbare classificator te trainen. Semi-supervised learning maakt gebruik van een kleine hoeveelheid gelabelde gegevens en een grote hoeveelheid niet-gelabelde gegevens. In dit artikel wordt semi-supervised learning op basis van labelpropagatie onderzocht voor de taak van hate speech classificatie. De kwaliteit van het labelen van de set zonder label hangt af van de invoerrepresentaties. In dit werk laten we zien dat voorgetrainde representaties label agnostisch zijn en wanneer gebruikt met label propagatie slechte resultaten opleveren. Neurale netwerkgebaseerde fine-tuning kan worden toegepast om taakspecifieke representaties te leren met behulp van een kleine hoeveelheid gelabelde gegevens. We laten zien dat volledig afgestemde representaties niet altijd de beste representaties zijn voor de labelpropagatie en dat intermediaire representaties beter kunnen presteren in een semi-supervised setup.Abstract
Forskning om hatt taleklassifikasjon har fått økt oppmerksomhet. I verkeleg livsfunksjonar er det tilgjengeleg ein liten mengda merkelige hattfunkstaledata for å trena ein tiltrukkeleg klassifiserer. Halvoversikt læring tar nyttig av ein liten mengd merkelige data og stor mengd ukjende data. I denne papiret vert læring med halvoversikt på merkelappen utforska for oppgåva av hatt taleklassifikasjon. Kvaliteten til merkelappen på den ikkje merkelige settet avhengig av inndatarepresentasjonane. I denne arbeiden viser vi at føretrainerte representasjonar er merkelappen agnostisk, og når brukt med merkelappepropagasjonen gjer feil resultat. Nøyralt nettverksbasert finnstilling kan brukast for å lære oppgåvelege representasjonar med lite mengda merkelige data. Vi viser at fullstendige representasjonar kan ikkje alltid vera dei beste representasjonane for etikettvaringa og mediane representasjonar kan utføra betre i ein halvoversikt oppsett.Abstract
Badania nad klasyfikacją mowy nienawiści zyskały większą uwagę. W rzeczywistych scenariuszach dostępna jest niewielka ilość oznaczonych danych o mowie nienawiści, aby szkolić niezawodny klasyfikator. Nauka pół-nadzorowana wykorzystuje niewielką ilość oznakowanych danych i dużą ilość nieoznakowanych danych. W niniejszym artykule badano naukę opartą na propagacji etykiet pół-nadzorowaną dla zadania klasyfikacji mowy nienawiści. Jakość etykietowania nieoznakowanego zestawu zależy od reprezentacji wejściowych. W niniejszej pracy pokazujemy, że wstępnie przeszkolone reprezentacje są agnostyczne etykiet, a gdy są stosowane z propagacją etykiet dają słabe wyniki. Można przyjąć neuronalne dostrajanie sieci, aby nauczyć się reprezentacji specyficznych dla zadań przy użyciu niewielkiej ilości etykietowanych danych. Pokazujemy, że w pełni dostrojone reprezentacje mogą nie zawsze być najlepszymi reprezentacjami dla propagacji etykiety, a reprezentacje pośrednie mogą działać lepiej w konfiguracji pół-nadzorowanej.Abstract
A pesquisa sobre a classificação do discurso de ódio tem recebido maior atenção. Em cenários da vida real, uma pequena quantidade de dados rotulados de discurso de ódio está disponível para treinar um classificador confiável. O aprendizado semi-supervisionado aproveita uma pequena quantidade de dados rotulados e uma grande quantidade de dados não rotulados. Neste artigo, o aprendizado semissupervisionado baseado em propagação de rótulos é explorado para a tarefa de classificação de discurso de ódio. A qualidade de rotular o conjunto não rotulado depende das representações de entrada. Neste trabalho, mostramos que representações pré-treinadas são agnósticas de rótulos e, quando usadas com propagação de rótulos, produzem resultados ruins. O ajuste fino baseado em rede neural pode ser adotado para aprender representações específicas de tarefas usando uma pequena quantidade de dados rotulados. Mostramos que representações totalmente ajustadas nem sempre podem ser as melhores representações para a propagação de rótulos e representações intermediárias podem ter melhor desempenho em uma configuração semi-supervisionada.Abstract
Cercetările privind clasificarea discursului la ură au primit o atenție sporită. În scenariile din viața reală, o cantitate mică de date etichetate privind discursul de ură este disponibilă pentru a instrui un clasificator de încredere. Învățarea semi-supravegheată profită de o cantitate mică de date etichetate și de o cantitate mare de date fără etichete. În această lucrare, învățarea semi-supravegheată bazată pe propagarea etichetelor este explorată pentru sarcina clasificării discursului la ură. Calitatea etichetării setului fără etichete depinde de reprezentările de intrare. În această lucrare, arătăm că reprezentările pre-instruite sunt agnostice de etichetă, iar atunci când sunt utilizate cu propagarea etichetei dau rezultate slabe. Reglarea fină bazată pe rețea neurală poate fi adoptată pentru a învăța reprezentări specifice sarcinilor utilizând o cantitate mică de date etichetate. Arătăm că reprezentările complet reglate nu sunt întotdeauna cele mai bune reprezentări pentru propagarea etichetei, iar reprezentările intermediare pot performa mai bine într-o configurație semi-supravegheată.Abstract
Все большее внимание уделяется исследованиям в области классификации ненавистнических высказываний. В реальных сценариях для обучения надежного классификатора доступно небольшое количество помеченных данных о ненавистнических высказываниях. Полунадзорное обучение использует небольшое количество помеченных данных и большое количество немеченных данных. В этой статье полунадзорное обучение на основе распространения ярлыков изучается для задачи классификации ненавистнических высказываний. Качество маркировки немаркированного набора зависит от входных представлений. В этой работе мы показываем, что предварительно обученные представления являются агностическими по метке, и при использовании с распространением метки дают плохие результаты. Точная настройка на основе нейронной сети может быть принята для изучения представлений конкретных задач с использованием небольшого количества помеченных данных. Мы показываем, что полностью отлаженные представления не всегда могут быть лучшими представлениями для распространения этикеток, а промежуточные представления могут работать лучше в полуконтролируемой установке.Abstract
වෛර කතා විශ්වාසය ගැන පරීක්ෂණය විශ්වාස කරලා තියෙනවා. ඇත්ත ජීවිතයේ සීනාරියෝ වලින්, විශ්වාස කරන්න පුළුවන් විශ්වාස කරන්න පුළුවන් විශ්වාස කරන්න පුළ පරීක්ෂා කරලා ඉගෙන ගන්න පුළුවන් ලෙබෙල් කරපු දත්ත සහ ලොකු ප්රමාණයක් නැති දත්ත. මේ පත්තරේ ලේබල් ප්රවේශනය අධ්යාත්මක විශ්වාසයෙන් අධ්යාත්මක පරීක්ෂණය කරලා ඉගෙනගන්න පුළුවන් ලේබල් නැති සෙට්ටුව ලබාගන්න ප්රතිශේෂතාව අවශ්ය වෙනවා ඇතුළු ප්රතිශේෂණය. මේ වැඩේදී, අපි පෙන්වන්නේ ප්රධානය කරපු ප්රධානයක් ලේබුල් ගැනිස්ටික් කියලා, ඒ වගේම ලේබුල් ප්රධානය ස න්යූරාල ජාලය සඳහා ප්රතිචාරය සඳහා ප්රතිචාරයක් ඉගෙන ගන්න පුළුවන් විශේෂ ප්රතිචාරයක් ලේබ අපි පෙන්වන්නේ හැම වෙලාවෙම හැම වෙලාවෙම හොඳම ප්රතිනිධානයක් නෙවෙයි කියලා ලේබල් ප්රතිනිධානයට හැමවෙලාවෙම හැම විශේෂAbstract
Raziskave o klasifikaciji sovražnega govora so deležne večje pozornosti. V resničnih scenarijih je na voljo majhna količina označenih podatkov o sovražnem govoru za usposabljanje zanesljivega klasifikatorja. Polnadzorovano učenje izkorišča majhno količino označenih podatkov in veliko količino neoznačenih podatkov. V prispevku je raziskano polnadzorovano učenje na podlagi širjenja oznak za nalogo klasifikacije sovražnega govora. Kakovost označevanja neoznačenega nabora je odvisna od vhodnih predstavitev. V tem delu smo pokazali, da so vnaprej usposobljene reprezentacije agnostične etikete, in kadar se uporabljajo z razmnoževanjem etiket, prinašajo slabe rezultate. Z majhno količino označenih podatkov je mogoče sprejeti fino nastavitev živčnega omrežja, ki temelji na živčnem omrežju. Pokazali smo, da popolnoma natančno nastavljene predstavitve morda niso vedno najboljše predstavitve za razmnoževanje etiket, vmesne predstavitve pa so lahko boljše v polnadzorovani nastavitvi.Abstract
Baaritaanka ku saabsan fasalka hadalka nebcaalka ayaa kordhay. Xaaladaha nololeed ee runta ah waxaa laga heli karaa macluumaad la xiriira hadalka nacaybka ah oo yar oo la baro fasax aamin ah. Waxbarashada qeybta lagu ilaaliyey wuxuu faa'iido ka qaataa tiro yar oo lagu qoray iyo tiro badan oo aan la aqoon karin. Qoraalkan waxaa lagu baaraandegayaa waxbarashada qoraalka ah oo lagu soo bandhigay barashada qoraalka ah. Qiimaha la xiriira alaabta aan la aqoonin waxay ku xiran tahay wakiilada gudaha. In this work, we show that pre-trained representations are label agnostic, and when used with label propagation yield poor results. Shabakada naadiga ah ee ku saleysan waxaa lagu qaadan karaa si aad u barto noocyo cayiman oo shaqo ah, si aad u isticmaasho macluumaad yar oo la qoray. Waxaynu muujinnaa in qofka aad u fiirsan karo ayadoo aan mar walba ahayn kuwa ugu fiican qaabilaada warqadda calaamada iyo noocyada dhexe looga baahan karo mid ka wanaagsan xarunta halka ilaaliya.Abstract
Kërkimi mbi klasifikimin e fjalëve të urrejtjes ka marrë më shumë vëmendje. Në skenarët e jetës reale, një sasi e vogël të dhënash të etiketuara të fjalimit të urrejtjes është në dispozicion për të trajnuar një klasifikues të besueshëm. Mësimi gjysmë i mbikqyrur përfiton nga një sasi e vogël e të dhënave të etiketuara dhe një sasi e madhe e të dhënave jo të etiketuara. Në këtë letër, mësimi gjysmë i mbikqyrur bazuar në përhapjen e etiketës eksplorohet për detyrën e klasifikimit të fjalimit të urrejtjes. Kualiteti i etiketave të grupit pa etiketë varet nga përfaqësimet e hyrjes. Në këtë punë, ne tregojmë se përfaqësimet e paratrajnuara janë etiketa agnostike dhe kur përdoren me etiketën e përhapjes japin rezultate të dobëta. Mund të miratohet rregullimi i rrjetit nervor për të mësuar përfaqësime specifike për detyrat duke përdorur një sasi të vogël të dhënash të etiketuara. We show that fully fine-tuned representations may not always be the best representations for the label propagation and intermediate representations may perform better in a semi-supervised setup.Abstract
Istraživanje o klasifikaciji govora mržnje dobilo je povećanu pažnju. U scenarijima stvarnog života, dostupna je mala količina označenih podataka o govoru mržnje za obuku pouzdanog klasifikatora. Polovično nadgledano učenje koristi mali količin označenih podataka i veliku količinu neopisivanih podataka. U ovom papiru, napola nadzirano učenje na osnovu propagacije istražuje za zadatak klasifikacije govora mržnje. Kvaliteta označavanja nezabeliranog seta zavisi od predstavljanja ulaza. U ovom poslu pokazujemo da su predobučeni predstavnici agnostični, a kada se koristi sa propagacijom etiketa, donose loše rezultate. Neuralna mreža može biti usvojena kako bi naučila specifične predstave na zadatku koristeći malu količinu označenih podataka. Pokazujemo da potpuno ispravni predstavnici ne mogu uvijek biti najbolji predstavnici za propagaciju etiketa i prosječne predstave mogu biti bolji u polu-nadzornom setu.Abstract
Forskning om hattalsklassificering har fått ökad uppmärksamhet. I verkliga scenarier finns en liten mängd märkta hattalsdata tillgängliga för att utbilda en pålitlig klassificerare. Halvövervakat lärande utnyttjar en liten mängd märkta data och en stor mängd omärkta data. I denna uppsats utforskas etikettspridningsbaserat semi-övervakat lärande för uppgiften att klassificera hattalan. Kvaliteten på märkningen av den omärkta uppsättningen beror på indatarepresentationerna. I detta arbete visar vi att förutbildade representationer är etikettagnostiska, och när de används med etikettspridning ger dåliga resultat. Neural nätverksbaserad finjustering kan användas för att lära sig uppgiftsspecifika representationer med hjälp av en liten mängd märkta data. Vi visar att helt finjusterade representationer kanske inte alltid är de bästa representationerna för etikettspridning och mellanliggande representationer kan prestera bättre i en halvövervakad installation.Abstract
Utafiti wa kutangazwa kwa hotuba ya chuki umeongezeka sana. Katika hali halisi ya maisha, kiasi kidogo cha takwimu za hotuba za chuki zinapatikana kufundisha kundi linaloaminika. Elimu inayofuatiliwa na sekondari inatumia kiasi kidogo cha takwimu zinazoonyesha na kiasi kikubwa cha taarifa zisizotambuliwa. Katika gazeti hili, elimu yenye msingi wa propaganda inayofuatiliwa na semi zinatafuta kwa ajili ya kazi ya kutangaza hotuba ya chuki. Ukubwa wa kuweka maambukizi yasiyofahamika unategemea maonesho ya input. Katika kazi hii, tunaonyesha kuwa wakilishi walio na mafunzo ya awali ni alama ya kuongezeka, na pale wanapotumika kwa propaganda za alama zinaleta matokeo mabaya. Utafiti mzuri wa mtandao wa kijamii unaweza kuchaguliwa ili kujifunza uwakilishi maalum wa kazi kwa kutumia kiasi kidogo cha taarifa zilizowekwa. We show that fully fine-tuned representations may not always be the best representations for the label propagation and intermediate representations may perform better in a semi-supervised setup.Abstract
வெறுப்பு பேச்சு வகுப்பு பற்றிய ஆராய்ச்சி அதிகப்படுத்தப்பட்டது. உண்மையான வாழ்க்கை காட்சியில், ஒரு சிறிய அளவு குறிப்பிடப்பட்ட வெறுப்பு பேச்சு தரவு ஒரு நம்பிக்கை வகுப்பாளரை பய Semi-supervised learning takes advantage of a small amount of labeled data and a large amount of unlabeled data. இந்த காகிதத்தில், விளக்கச்சீட்டு பொருள் வகைப்படுத்தப்பட்ட பாதை கண்காணிக்கப்பட்டுள்ளது. குறிப்பிடப்படாத அமைப்புகளின் தரம் உள்ளீட்டு குறிப்புகளை சார்ந்தது. இந்த வேலையில், முன் பயிற்சிக்கப்பட்ட குறிப்பிட்ட குறிப்பிட்ட குறிப்புகள் குறிப்பிட்ட விளக்கச்சீட்டு கு சிறிய குறிப்பிட்ட தரவை பயன்படுத்தி பணி- குறிப்பிட்ட குறிப்பிட்ட குறிப்பிட்ட குறிப்பிட்ட பகுதிகளை கற்றுக நாம் காண்பிக்கிறோம் முழுமையான நன்றாக குறிப்புகள் எப்போதும் சிறந்த குறிப்புகளாக இருக்க முடியாது என்பதை காட்டுகிறோம் என்Abstract
Ýigrenýän çykyş klasifikasynda diýenler üns berilýär. Gerçek durmuş senaryýalarda, ýigrenýän çykyş maglumatlarynyň kiçi sany güýçli klasifikatçysyny öwretmek üçin bar. Yarı gözlemli öğrenmek etiket edilen küçük miktardan ve yazılmadan büyük bir miktardan fayda alır. Bu kagyzda, etiket tabanly semi-gözlemli öwrenmek ýigrenýän çykyş klasifikasy üçin gözlenýär. Yazılmayan takımın keyfiyeti girdi temsillerine bağlı. Bu işte, öňündeki temsiller agnostik etiketlerdir ve etiket propagasyonu bilen kullanılan zaman zavallı neticeler getirir. Nöral şebeke tabanly fin-tuning üçin täze hili takykly hatlary öwrenmek üçin ullanylabilir. Biz tam şekilde düzeltilmiş temsiller etiket genişlemesi ve orta yön gösterimlerin her zaman en iyi temsilleri olabileceğini gösteriyoruz.Abstract
ناپسندیدہ بات کلیسی کا تحقیق اضافہ کیا گیا ہے۔ حقیقی زندگی سناریوں میں ایک چھوٹی مقدار لکھی ہوئی hate speech data کے لئے ایک قابل کلاسیر کی آموزش کرنے کے لئے موجود ہے. نصف نظارت کی تعلیم ایک چھوٹی مقدار لکھی ہوئی ڈیٹا اور بہت بڑی مقدار غیر لکھی ہوئی ڈیٹا سے فائدہ اٹھاتی ہے. اس کاغذ میں، لیبل پھیلانے کی نصف نظارت کی تعلیم کے لئے نفرت بات کلیسی کے کام کے لئے تحقیق کی جاتی ہے. ناپذیر سٹ کی لابلینگ کی کیفیت input representations پر مضبوط ہے. ہم اس کام میں دکھاتے ہیں کہ پہلے کی تعلیم کی نشانیاں لیبل اگنیسی ہیں، اور جب لیبل پھیلانے کے ساتھ استعمال کیا گیا تو کمزور نتیجے پاتے ہیں۔ نیورال نیٹ ورک کی بنیاد پاکیزہ ٹونگ کی تعلیم کے لئے استعمال کی جاتی ہے تاکہ ایک چھوٹی مقدار لیبل ڈیٹا کے استعمال کریں۔ ہم دکھاتے ہیں کہ پوری طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرح طرحAbstract
Hat so'zni tahrirlash taʼminoti o'zgartiradi. Mavjud hayoti taqdimotida, ishonroq bo'lgan foydalanuvchi haqida bir nechta qisqa maʼlumot mavjud. @ info: whatsthis Ushbu qogʻozda, yorliq propaganday o'rganish qanchalik o'rganishni o'rganish uchun o'rganadi. @ info: whatsthis Bu ishda o'rganishdan oldin taʼminlovchi tashkilotlarni angnostik deb tushunamiz va yorliq propaganda ishlatilganda yomon natijalarni bajaradi. Name Biz ko'rayapmiz, butunlay ajratilgan tashkilotlar hamisha yorliq propaganda ko'rsatilgan eng yaxshi xususiyatlar emas va o'rtacha taʼminlovchi tashkilotlarni ajratish mumkin.Abstract
Nghiên cứu về phân loại ngôn ngữ ghét đã được chú ý nhiều hơn. Trong các tình huống đời thực, một số lượng nhỏ các dữ liệu tiêu biểu căm ghét có sẵn để đào tạo một người phân loại đáng tin cậy. Tiểu giám sát học lợi dụng một lượng nhỏ các dữ liệu ghi nhãn và một lượng lớn dữ liệu chưa được tải. In this paper, nhãn propagation-based semi-giám sát study được khám phá cho nhiệm vụ phân loại ngôn ngữ ghét. Chất lượng được dán nhãn tùy thuộc vào các biểu đồ nhập. Chúng tôi cho thấy các biểu tượng được huấn luyện trước là đóng nhãn bồ đà, và khi được sử dụng với nhãn truyền dẫn đến kết quả xấu. Thay đổi cấu trúc thần kinh trên mạng có thể được chọn để học các trình bày đặc nhiệm, sử dụng một lượng nhỏ các dữ liệu dán nhãn. Chúng tôi cho thấy các biểu tượng hoàn toàn chỉnh chỉnh sửa không phải luôn là những biểu tượng tốt nhất cho việc rải nhãn và các biểu tượng trung ương có thể diễn tốt hơn trong một thiết lập được giám sát gần.Abstract
夫仇言之类益多。 现实生活之中,少仇言数,可以练器。 半督学用少标数及大未标数。 本文探讨了基于标签传播的半监督学习,以成仇恨分类的事务。 标未标集者,决于输也。 此其事,明先训不关标签,且当与标传相差也。 可以神经网络之微学少特定也。 吾言全微者,或非常标传之最佳,而中间示在半监设之中或为尤善。- Anthology ID:
- 2020.insights-1.8
- Volume:
- Proceedings of the First Workshop on Insights from Negative Results in NLP
- Month:
- November
- Year:
- 2020
- Address:
- Online
- Venues:
- EMNLP | insights
- SIG:
- Publisher:
- Association for Computational Linguistics
- Note:
- Pages:
- 54–59
- Language:
- URL:
- https://aclanthology.org/2020.insights-1.8
- DOI:
- 10.18653/v1/2020.insights-1.8
- Bibkey:
- Cite (ACL):
- Ashwin Geet D’Sa, Irina Illina, Dominique Fohr, Dietrich Klakow, and Dana Ruiter. 2020. Label Propagation-Based Semi-Supervised Learning for Hate Speech Classification. In Proceedings of the First Workshop on Insights from Negative Results in NLP, pages 54–59, Online. Association for Computational Linguistics.
- Cite (Informal):
- Label Propagation-Based Semi-Supervised Learning for Hate Speech Classification (D’Sa et al., insights 2020)
- Copy Citation:
- PDF:
- https://aclanthology.org/2020.insights-1.8.pdf
- Video:
- https://slideslive.com/38940795
- Terminologies:
Export citation
@inproceedings{dsa-etal-2020-label, title = "Label Propagation-Based Semi-Supervised Learning for Hate Speech Classification", author = "D{'}Sa, Ashwin Geet and Illina, Irina and Fohr, Dominique and Klakow, Dietrich and Ruiter, Dana", booktitle = "Proceedings of the First Workshop on Insights from Negative Results in NLP", month = nov, year = "2020", address = "Online", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2020.insights-1.8", doi = "10.18653/v1/2020.insights-1.8", pages = "54--59", }
<?xml version="1.0" encoding="UTF-8"?> <modsCollection xmlns="http://www.loc.gov/mods/v3"> <mods ID="dsa-etal-2020-label"> <titleInfo> <title>Label Propagation-Based Semi-Supervised Learning for Hate Speech Classification</title> </titleInfo> <name type="personal"> <namePart type="given">Ashwin</namePart> <namePart type="given">Geet</namePart> <namePart type="family">D’Sa</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Irina</namePart> <namePart type="family">Illina</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Dominique</namePart> <namePart type="family">Fohr</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Dietrich</namePart> <namePart type="family">Klakow</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Dana</namePart> <namePart type="family">Ruiter</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <originInfo> <dateIssued>2020-11</dateIssued> </originInfo> <typeOfResource>text</typeOfResource> <relatedItem type="host"> <titleInfo> <title>Proceedings of the First Workshop on Insights from Negative Results in NLP</title> </titleInfo> <originInfo> <publisher>Association for Computational Linguistics</publisher> <place> <placeTerm type="text">Online</placeTerm> </place> </originInfo> <genre authority="marcgt">conference publication</genre> </relatedItem> <identifier type="citekey">dsa-etal-2020-label</identifier> <identifier type="doi">10.18653/v1/2020.insights-1.8</identifier> <location> <url>https://aclanthology.org/2020.insights-1.8</url> </location> <part> <date>2020-11</date> <extent unit="page"> <start>54</start> <end>59</end> </extent> </part> </mods> </modsCollection>
%0 Conference Proceedings %T Label Propagation-Based Semi-Supervised Learning for Hate Speech Classification %A D’Sa, Ashwin Geet %A Illina, Irina %A Fohr, Dominique %A Klakow, Dietrich %A Ruiter, Dana %S Proceedings of the First Workshop on Insights from Negative Results in NLP %D 2020 %8 November %I Association for Computational Linguistics %C Online %F dsa-etal-2020-label %R 10.18653/v1/2020.insights-1.8 %U https://aclanthology.org/2020.insights-1.8 %U https://doi.org/10.18653/v1/2020.insights-1.8 %P 54-59
Markdown (Informal)
[Label Propagation-Based Semi-Supervised Learning for Hate Speech Classification](https://aclanthology.org/2020.insights-1.8) (D’Sa et al., insights 2020)
- Label Propagation-Based Semi-Supervised Learning for Hate Speech Classification (D’Sa et al., insights 2020)
ACL
- Ashwin Geet D’Sa, Irina Illina, Dominique Fohr, Dietrich Klakow, and Dana Ruiter. 2020. Label Propagation-Based Semi-Supervised Learning for Hate Speech Classification. In Proceedings of the First Workshop on Insights from Negative Results in NLP, pages 54–59, Online. Association for Computational Linguistics.