The Power of Character N-grams in Native Language Identification Die Krag van Karakter N- gramme in Natiewe Taal Identifikasie አቀማመጥ قوة الحرف N-grams في تحديد اللغة الأصلية Doğul Dil Kimliğində Karakter N-gramlərin gücü Силата на символните N-грами в идентификацията на родния език নিজের ভাষার পরিচয়ে অক্ষর N- গ্রামের শক্তি སྐད་རིགས་དམིགས་འཛུགས་ནང་གི་ཡིག་འབྲུ་N-grams ཀྱི་ནུས་པ Moć znakova N-grama u identifikaciji rođenog jezika El poder del caràcter N-grams en la identificació de la llengua nativa Síla N-gramů znaků v identifikaci rodného jazyka Effekten af tegn N-gram i native sprogidentifikation Die Kraft von Zeichen N-Grammen in der Native Language Identification Η δύναμη των γραμμάτων χαρακτήρων στην αναγνώριση της μητρικής γλώσσας El poder de los N-gramas de caracteres en la identificación del idioma nativo Märgi N-grammide võimsus emakeele identifitseerimisel قدرت شخصیت N گرم در شناسایی زبان طبیعی Merkkien N-grammien teho äidinkielen tunnistamisessa Le pouvoir des N-grammes de caractères dans l'identification de la langue maternelle Cumhacht Carachtair N-gram san Aitheantas Teanga Dúchais @ action The Power of Character N-grams in Native Language Identification मूल भाषा पहचान में चरित्र एन-ग्राम की शक्ति Moć znakova N-grama u identifikaciji prirodnog jezika A karakter N-gramm ereje az anyanyelv azonosításában Ն-գրամների ազդեցությունը բնիկ լեզվի հայտնաբերման մեջ Kekuatan N-gram Karakter dalam Identifikasi Bahasa asli Il potere dei caratteri N-grammi nell'identificazione della lingua nativa 母国語識別における文字Nグラムの力 Power of character N-gram in nate Language ID Name Түпнұсқа тіл идентификациясындағы N- граммалардың сипаттамасы 문자 N-gram의 모국어 식별에서의 역할 N-gramų simbolio galia gimtosios kalbos identifikavime Моќта на знакот N- грами во идентификацијата на родниот јазик സ്വാഭാവ ഭാഷയുടെ തിരിച്ചറിയിപ്പിലെ അക്ഷര് N- ഗ്രാമിന്റെ ശക്തി Зүүн хэл тодорхойлолтын N-граммын хүч чадал Kuasa Aksara N-gram dalam Pengenalan Bahasa asli Is-Setgħa tal-Karatteri N-grammi fl-Identifikazzjoni tal-Lingwa Nativa De kracht van teken N-grammen in Native Language Identificatie Strømmen på teikn N- gramer i naturspråk- identifisering Moc N-gramów znaków w identyfikacji języka ojczystego O Poder dos N-gramas de Caracteres na Identificação da Língua Nativa Puterea N-gramelor caractere în identificarea limbii native Сила символа N-граммы в идентификации родного языка Name Moč N-gramov znakov v identifikaciji maternega jezika Aqoonsiga afka asalka The Power of Character N-grams in Native Language Identification Moć karaktera N-grama u identifikaciji porodičnog jezika Kraften i tecken N-gram i ursprungsspråkets identifiering Nguvu ya Character N-grams katika utambulisho wa lugha asili மொழி அடையாளத்தில் உள்ள எழுத்து N- கிராம்களின் சக்தி Adaty Dilinde Karakter Name Asosiy tilning aniqlash uchun belgi N- grammasi Sức mạnh Kí tự N-grams của bản địa 字符 N 元语法在母语识之力也
Artur Kulmizev, Bo Blankers, Johannes Bjerva, Malvina Nissim, Gertjan van Noord, Barbara Plank, Martijn Wieling
Abstract
In this paper, we explore the performance of a linear SVM trained on language independent character features for the NLI Shared Task 2017. Our basic system (GRONINGEN) achieves the best performance (87.56 F1-score) on the evaluation set using only 1-9 character n-grams as features. We compare this against several ensemble and meta-classifiers in order to examine how the linear system fares when combined with other, especially non-linear classifiers. Special emphasis is placed on the topic bias that exists by virtue of the assessment essay prompt distribution.Abstract
In hierdie papier, ons ondersoek die prestasie van 'n lineêre SVM wat op taal onafhanklike karakter funksies gelei het vir die NLI Gedeelde Taak 2017. Ons basiese stelsel (GRONINGEN) bereik die beste prestasie (87. 56 F1- score) op die evaluasie stel gebruik slegs 1- 9 karakter n- grams as funksies. Ons vergelyk hierdie teen verskeie ensemble en meta-klassifiseerders om te ondersoek hoe die lineêre stelsel fart wanneer gekombineer word met ander, veral nie-lineêre klassifiseerders. Spesiale nagesmerking word op die onderwerp voorspoedige geplaas wat bestaan deur virtue van die evalueringsessay voorspoedig verspreiding.Abstract
በዚህ ፕሮግራም፣ ለNLI ስራ 2017 የቋንቋ ነጻ ባሕላዊ አርእስት ላይ የተማራውን የSVM ስርዓት ስርዓት መፈለግ እናደርጋለን፡፡ መሠረት ስርዓታችን ይሄንን ከሌሎቹ ይልቁንም ሳይታይ ክፍሎች ጋር እንዴት እንደተጋራረሙ የመስመር ሲስተካከል እናስተያየዋለን፡፡ የጉዳዩ ጉዳዩ ጉዳይ ፈጥኖ የተሰናከረ የኢሜይል ድምፅ በማድረግ ላይ ነው፡፡Abstract
في هذه الورقة ، نستكشف أداء SVM الخطي المُدرَّب على ميزات الأحرف المستقلة للغة لـ NLI Shared Task 2017. يحقق نظامنا الأساسي (GRONINGEN) أفضل أداء (87.56 درجة F1) على مجموعة التقييم باستخدام 1-9 فقط حرف n-grams كميزات. نقارن هذا بالعديد من المصنفات الوصفية والمجموعات من أجل دراسة كيفية أسعار النظام الخطي عند دمجها مع المصنفات الأخرى ، خاصة غير الخطية. يتم التركيز بشكل خاص على تحيز الموضوع الموجود بحكم التوزيع الفوري لمقال التقييم.Abstract
Bu kağızda, 2017 NLI paylaşılmış Task üçün dil bağımsız karakter özelliklərində təhsil edilmiş linear SVM performansını keşfetmişik. Bizim temel sistemimiz (GRONINGEN) ən yaxşı performans (87.56 F1-score) müəyyənləşdirilməsi üçün yalnız 1-9 karakter n-gramları istifadə edir. Biz bunu bir neçə ensemble və meta-klasifikatorla qarşılaşdırırıq ki, linear sistemin başqa, özellikle linear klasifikatorlar ilə birlikdə necə döyüşər? Özellikle təsiri təsirlərin təsirlərinə görə mövcud olan məsələn təsirlərinə qoyulmuşdur.Abstract
В настоящата статия изследваме изпълнението на линеен СВМ, обучен върху езикови независими характерни характеристики за споделената задача 2017. Нашата основна система (постига най-доброто представяне (87,56 точки) в комплекта за оценка, използвайки само 1-9 знака н-грама като функции. Сравняваме това с няколко ансамбъла и мета-класификатора, за да проучим как се справя линейната система, когато се комбинира с други, особено нелинейни класификатори. Специален акцент е поставен върху тематичната пристрастност, която съществува по силата на бързото разпространение на есето за оценка.Abstract
এই কাগজটিতে আমরা ভাষার স্বাধীন চরিত্রের বৈশিষ্ট্যে প্রশিক্ষণ প্রদান করেছি এনলি শেয়ার করা কাজ ২০১৭ এর জন্য। আমাদের মৌলিক ব্যবস্থা (GRONINGEN) শ্রেষ্ঠ ভাবে প্রদর্শন করে (৮7. 56 F1-স্কোর) শুধুমাত্র ১-৯ অক্ষর n-গ্রাম ব্যবহার করে মূল্য সেটির মানে We compare this against several ensemble and meta-classifiers in order to examine how the linear system fares when combined with other, especially non-linear classifiers. এই বিষয়ে বিশেষ জোর দেয়া হয়েছে যা দ্রুত বিতরণের মাধ্যমে উপস্থিত রয়েছে।Abstract
ང་ཚོས་ཤོག་བྱང་འདིའི་ནང་དུ་གྲལ་ཐིག་གི་SVM་གི་སྒྲ་ཚིགས་དང་སྦྲེལ་མཐུན་ཡོད་པའི་ NLI བསམ་བྱས་པའི་བྱ་འགུལ་ལ་རྒྱབ Our basic system (GRONINGEN) achieves the best performance (87.56 F1-score) on the evaluation set using only 1-9 character n-grams as features. ང་ཚོས་མཚོན་རྟགས་དང་meta-classifiers་ཚན་གཉིས་ཀྱི་གནད་དོན་འདི་ཇི་ལྟར་བྱེད་རྒྱུ་དང་གཞན་དང་ཁྱད་པར་གྲལ་རིམ་མིན་པའི་དབ དམིགས་བསལ་གཙོ་རིམ་འདི་དག་གི་གནད་དོན་ཡུལ་གྱི་ངོ་མ་ནང་དུ་བཙུགས་ཡོད།Abstract
U ovom papiru istražujemo funkciju linearnog SVM obučenog na jezičkim nezavisnim karakterskim karakterima za zajednički zadatak NLI 2017. Naš osnovni sistem (GRONINGEN) postiže najbolji rezultat (87,56 F1 rezultat) na procjeni koji koristi samo 1-9 znakova n-grama kao karakteristike. Uspoređujemo ovo sa nekoliko ensemblova i metaklasifikatora kako bi pregledali kako linearni sistem prodaje kada se kombinira sa drugim, posebno ne-linearnim klasifikatorima. Posebni naglasak se stavlja na temu predrasude koja postoji zbog brzog distribucije eseja procjene.Abstract
En aquest article, explorem el desempeny d'un SVM linear entrenat en característices de caràcter independents del llenguatge per la tasca compartida NLI 2017. El nostre sistema bàsic (GRONINGEN) aconsegueix el millor rendiment (87,56 puntuacions F1) en el conjunt d'evaluacions utilitzant només 1-9 caracteres n-grams com característiques. Comparem això amb diversos conjunts i meta-classificadors per examinar com funciona el sistema linear quan es combina amb altres, especialment no linears. S'enfatiza especialment en el bias temàtic que existeix gràcies a la distribució ràpida de l'assaig d'evaluació.Abstract
V tomto článku zkoumáme výkon lineárního SVM trénovaného na jazykově nezávislé znakové vlastnosti pro sdílenou úlohu NLI 2017. Náš základní systém (GRONINGEN) dosahuje nejlepšího výkonu (87,56 F1-skóre) na hodnotící sadě pomocí pouze 1-9 znaků n-gramů jako vlastností. Porovnáváme to s několika souborovými a metaklasifikátory, abychom zkoumali, jak se vede lineární systém v kombinaci s jinými, zejména nelineárními klasifikátory. Zvláštní důraz je kladen na téma zaujatosti, která existuje na základě promptní distribuce hodnotící eseje.Abstract
I denne artikel undersøger vi ydeevnen af en lineær SVM uddannet i sproguafhængige karakterfunktioner til NLI Shared Task 2017. Vores grundlæggende system (GRONINGEN) opnår den bedste ydeevne (87,56 F1-score) på evalueringssættet ved hjælp af kun 1-9 tegn n-gram som funktioner. Vi sammenligner dette med flere ensemble- og metaklassifikationer for at undersøge, hvordan det lineære system klarer sig, når det kombineres med andre, især ikke-lineære klassifikationer. Der lægges særlig vægt på den emne bias, der eksisterer i kraft af vurderingsessay prompt distribution.Abstract
In diesem Beitrag untersuchen wir die Leistungsfähigkeit eines linearen SVM, das auf sprachunabhängigen Charaktereigenschaften für die NLI Shared Task 2017 trainiert wurde. Unser Basissystem (GRONINGEN) erzielt die beste Leistung (87,56 F1-Score) auf dem Auswertungsset mit nur 1-9 Zeichen n-Gramm als Features. Wir vergleichen dies mit mehreren Ensemble- und Metaklassifikatoren, um zu untersuchen, wie sich das lineare System in Kombination mit anderen, insbesondere nichtlinearen Klassifikatoren entwickelt. Besonderes Augenmerk wird auf die Thematik Bias gelegt, die aufgrund der prompten Verteilung des Assessment Essays besteht.Abstract
Σε αυτή την εργασία, διερευνούμε την απόδοση ενός γραμμικού SVM εκπαιδευμένου σε γλωσσικά ανεξάρτητα χαρακτηριστικά χαρακτήρων για την κοινή εργασία 2017. Το βασικό μας σύστημα (επιτυγχάνει την καλύτερη απόδοση (87.56 F1-βαθμολογία) στο σύνολο αξιολόγησης χρησιμοποιώντας μόνο 1-9 γραμμάτων χαρακτήρων ως χαρακτηριστικά. Συγκρίνουμε αυτό με διάφορους συνόλους και μετα-ταξινομητές για να εξετάσουμε πώς λειτουργεί το γραμμικό σύστημα όταν συνδυάζεται με άλλους, ειδικά μη γραμμικούς ταξινομητές. Ιδιαίτερη έμφαση δίνεται στη θεματική προκατάληψη που υπάρχει λόγω της άμεσης διανομής της έκθεσης αξιολόγησης.Abstract
En este artículo, exploramos el rendimiento de una SVM lineal entrenada en funciones de caracteres independientes del idioma para la tarea compartida de NLI 2017. Nuestro sistema básico (GRONINGEN) logra el mejor rendimiento (87,56 puntos F1) en el conjunto de evaluación utilizando solo n-gramas de 1 a 9 caracteres como características. Comparamos esto con varios conjuntos y meta-clasificadores para examinar cómo funciona el sistema lineal cuando se combina con otros, especialmente los clasificadores no lineales. Se hace especial hincapié en el sesgo de tema que existe en virtud de la distribución rápida del ensayo de evaluación.Abstract
Käesolevas töös uurime NLI Shared Task 2017. aasta keelesõltumatute märgifunktsioonide alal koolitatud lineaarse SVM-i jõudlust. Meie põhisüsteem (GRONINGEN) saavutab hindamiskomplekti parima jõudluse (87,56 F1-skoori), kasutades funktsioonidena ainult 1-9 tähemärki n-grammi. Võrdleme seda mitmete ansamblite ja metaklassifikaatoritega, et uurida, kuidas lineaarne süsteem toimib kombineerituna teiste, eriti mittelineaarsete klassifikaatoritega. Erilist rõhku pööratakse teemalisele eelarvamusele, mis eksisteerib tänu hindamiseessee kiirele levitamisele.Abstract
در این کاغذ، عملکرد یک SVM linear trained on language independent character features for the NLI Shared Task 2017 explore the performance of a linear SVM trained on the language independent character features. سیستم بنیادی ما (GRONINGEN) بهترین عملکرد (87.56 امتیاز F1) را در مجموعه ارزیابی با استفاده تنها 1-9 شخصیت n-گرم به عنوان ویژگی میرسد. ما این را با چندین تنظیم و مترابطهگران مقایسه میکنیم تا بررسی کنیم که چگونه سیستم خطی وقتی با بقیه، مخصوصا با گروهگران غیرخطی میرود. تسبیح ویژه بر روی تغییرات موضوع قرار میگیرد که بر خلاف توزیع توزیع آزمایش سریع توزیع است.Abstract
Tässä artikkelissa tutkimme lineaarisen SVM:n suorituskykyä, joka on koulutettu kieliriippumattomiin merkkiominaisuuksiin NLI Shared Task 2017 -ohjelmassa. Perusjärjestelmämme (GRONINGEN) saavuttaa parhaan suorituskyvyn (87,56 F1-pistettä) arviointisarjassa käyttämällä vain 1-9 merkkiä n-grammaa ominaisuuksina. Vertaamme tätä useisiin kokonaisuuksiin ja meta-luokittelijoihin selvittääksemme, miten lineaarinen järjestelmä toimii yhdistettynä muihin, erityisesti epälineaarisiin luokittelijoihin. Erityistä painoarvoa kiinnitetään arviointiesseen pikajakelun perusteella esiintyvään aihebiakseen.Abstract
Dans cet article, nous explorons les performances d'une SVM linéaire formée aux caractéristiques de caractères indépendantes de la langue pour la tâche partagée NLI 2017. Notre système de base (GRONINGUE) atteint les meilleures performances (87,56 score F1) sur le jeu d'évaluation en utilisant uniquement des n-grammes de 1 à 9 caractères comme caractéristiques. Nous comparons cela à plusieurs ensembles et méta-classificateurs afin d'examiner comment le système linéaire se comporte lorsqu'il est combiné avec d'autres classificateurs, en particulier non linéaires. Un accent particulier est mis sur le biais de sujet qui existe en raison de la distribution rapide de la dissertation d'évaluation.Abstract
Sa pháipéar seo, déanaimid iniúchadh ar fheidhmíocht SVM líneach oilte ar ghnéithe carachtair neamhspleácha teanga le haghaidh Tasc Comhroinnte LNÉ 2017. Baineann ár gcóras bunúsach (GRONINGEN) an fheidhmíocht is fearr (87.56-scór F1) amach ar an tacar meastóireachta ag baint úsáide as ach 1-9 carachtar n-gram mar ghnéithe. Déanaimid é seo a chur i gcomparáid le roinnt aicmitheoirí ensemble agus meiti-aicmithe chun scrúdú a dhéanamh ar an gcaoi a n-éiríonn leis an gcóras líneach nuair a chuirtear le chéile é le haicmitheoirí eile, go háirithe neamhlíneach. Leagtar béim faoi leith ar an gclaonadh topaicí atá ann de bhua dáileadh leid na n-aiste measúnaithe.Abstract
Ga wannan takardan, Munã karatun mafarin SvM mai tsaro a kan harshen salon karatun da ba'a kare shi ba na rubutu wa NLI mai Sharan aikin 2017. Ga muhalli na GronINGEN ya sãmu mafi kyaun aikin aiki (87.46 F1-score) kan an ƙayyade yin amfani da kawai 1-9 character n-gram kamar sifati. Kana samfani wannan a kan wasu misãlai da meta-darafõfi, dõmin Mu jarraba cewa muhallin linsafi na tafiyar idan da aka haɗa shi da wasu, kuma, hususan, fasalarari masu lissafa. Special emphasis is placed on the topic bias that exists by virtue of the assessment essay prompt distribution.Abstract
בעיתון הזה, אנו חוקרים את ההופעה של SVM לינרי מאומן על תכונות אופי עצמאי לשפה עבור משימה משותפת NLI 2017. המערכת הבסיסית שלנו (GRONINGEN) משיגה את ההופעה הטובה ביותר (87.56 F1-score) על קבוצת הערכה בשימוש רק 1-9 אופי n-גרם כתכונות. אנחנו משוותים את זה עם מספר אסמבלים ומטה-קלאספים כדי לבדוק איך מערכת לינרית מתאימה כשמשולבלת עם אחרים, במיוחד לא-לינריים קלאספים. התמקדות מיוחדת מונחת על ההתמחות הנושאית שקיימת בעקבות המאמר ההערכה פיצול מהיר.Abstract
इस पेपर में, हम एनएलआई साझा कार्य 2017 के लिए भाषा स्वतंत्र चरित्र सुविधाओं पर प्रशिक्षित रैखिक एसवीएम के प्रदर्शन का पता लगाते हैं। हमारी मूल प्रणाली (GRONINGEN) केवल 1-9 चरित्र n-ग्राम सुविधाओं के रूप में उपयोग करके मूल्यांकन सेट पर सबसे अच्छा प्रदर्शन (87.56 F1-स्कोर) प्राप्त करता है। हम इसकी तुलना कई पहनावा और मेटा-क्लासिफायरों के खिलाफ करते हैं ताकि यह जांच की जा सके कि रैखिक प्रणाली अन्य, विशेष रूप से गैर-रैखिक क्लासिफायरके साथ संयुक्त होने पर कैसे किराए लेती है। विशेष जोर विषय पूर्वाग्रह है कि मूल्यांकन निबंध शीघ्र वितरण के आधार पर मौजूद है पर रखा जाता है.Abstract
U ovom papiru istražujemo provedbu linearnog SVM-a obučenog na jezičkim nezavisnim karakterskim karakterima za zajednički zadatak NLI 2017. Naš osnovni sustav (GRONINGEN) postiže najbolji rezultat (87,56 F1 rezultat) na procjeni koji koristi samo 1-9 znakova n-grama kao karakteristike. To uspoređujemo s nekoliko ensembla i metaklasifikatora kako bi pregledali kako linearni sustav prodaje kada se kombinira s drugim, posebno ne linearnim klasifikatorima. Posebni naglasak se stavlja na temu predrasude koja postoji zbog brzog distribucije eseja procjene.Abstract
Ebben a tanulmányban egy lineáris SVM teljesítményét vizsgáljuk fel, amelyet a 2017-es NLI Shared Task nyelvfüggetlen karakterek funkcióiról készítettek. Alapvető rendszerünk (GRONINGEN) a legjobb teljesítményt (87,56 F1 pontszám) érte el az értékelőkészleten, mindössze 1-9 karakter n grammot használva. Ezt több együttes- és metaosztályozóval hasonlítjuk össze annak érdekében, hogy megvizsgáljuk, hogyan viselkedik a lineáris rendszer más, különösen nem lineáris osztályozókkal kombinálva. Különös hangsúlyt fektetnek az értékelési esszé azonnali eloszlása miatt fennálló témaköri elfogultságra.Abstract
Այս թղթի մեջ մենք ուսումնասիրում ենք գծային ՍՎՄ-ի արտադրողությունը, որը պատրաստված է անկախ լեզվի բնույթի առանձնահատկությունների վրա 2017 թվականին ՆԼԻ-ի կիսված հանձնարարության համար: Մեր հիմնական համակարգը (GROININGN) հասնում է ամենալավ արդյունքին (87.56 F1-գնահատականի) գնահատականի համակարգում, օգտագործելով միայն 1-9 բնավոր n-գրամ որպես առանձնահատկություններ: Մենք համեմատում ենք սա մի քանի անկյունների և մետադասավորողների հետ, որպեսզի ուսումնասիրենք, թե ինչպես է գծային համակարգը համընկնում այլ, հատկապես ոչ գծային դասավորողների հետ: Հատկապես ուշադրություն է դարձնում թեմային կողմնականության վրա, որը գոյություն ունի գնահատման էսսի արագ տարածման շնորհիվ:Abstract
Dalam kertas ini, kami mengeksplorasi prestasi SVM linear dilatih pada karakter bahasa independen karakter untuk NLI Shared Task 2017. Sistem dasar kami (GRONINGEN) mencapai prestasi terbaik (87,56 F1-skor) pada set evaluasi menggunakan hanya 1-9 karakter n-gram sebagai fitur. Kita membandingkan ini dengan beberapa ensemble dan meta-klasifikasi untuk memeriksa bagaimana sistem linear berkembang ketika dikombinasikan dengan lainnya, terutama klasifikasi non-linear. Fokus khusus ditempatkan pada bias topik yang ada karena eksi penilaian distribusi cepat.Abstract
In questo articolo esploriamo le prestazioni di un SVM lineare formato sulle caratteristiche dei caratteri indipendenti dalla lingua per l'NLI Shared Task 2017. Il nostro sistema base (GRONINGEN) raggiunge le migliori prestazioni (87,56 F1-score) sul set di valutazione utilizzando solo 1-9 caratteri n-grammi come caratteristiche. Confrontiamo questo con diversi ensemble e meta-classificatori al fine di esaminare come il sistema lineare se combinato con altri classificatori, specialmente non lineari. Particolare enfasi è posta sul bias tematico che esiste in virtù della distribuzione rapida del saggio di valutazione.Abstract
この論文では、NLI Shared Task 2017の言語に依存しない文字機能についてトレーニングされた線形SVMのパフォーマンスを探ります。当社の基本システム( GRONINGEN )は、1 ~ 9文字のnグラムのみを特徴として評価セットで最高のパフォーマンス( 87.56 F 1スコア)を実現しています。これをいくつかのアンサンブルおよびメタ分類子と比較して、線形システムが他の、特に非線形分類子と組み合わされたときにどのように機能するかを検討します。評価論文の迅速な配布によって存在するトピックバイアスを特に重視する。Abstract
Nang pepulan iki, kita sislah akeh bantuan SVM liyar nggawe pawaran cara-cara sing wis dipunaaken kanggo nggawe NLI shared tasks 1997. Where am I Awak dhéwé nggerarungu iki karo akeh akeh lansangan lan meta-klasik kanggo bisa nguasai siji dadi, peduli diagonalan karo sekondirno sing wis dipun Pesemphasis sing dibutungane soko nggawe persilangan tema iki dadi, suku kerusane tentang kanggo tukang winih.Abstract
ამ დომენტში, ჩვენ 2017-ს NLI გაყოფილი სამუშაო სამუშაო სამუშაო სიმბოლოებისთვის linear SVM-ის გამოყენებას გავაკეთებთ. ჩვენი ფესტური სისტემა (GRONINGEN) უკეთესი გამოყენება (87.56 F1- score) განსაზღვრების შესახებ მხოლოდ 1- 9 სიმბოლოების n- გრამის გამოყენება. ჩვენ ამას შემდგომარებით რამდენიმე ინსნემბელი და მეტა-კლასიფიკაციერებისთვის, როგორ ლეინერი სისტემის გადასრულება, როცა სხვა, განსაკუთრებით არ-ლეინერი კ სპეციალური განსაზღვრება იქნება ტემების განსაზღვრებაზე, რომელიც არსებობს განსაზღვრებული ესესის შესახებ სწრაფად განსაზღვრება.Abstract
Бұл қағазда 2017 NLI ортақ тапсырмасының тілдерінің тәуелсіздік таңбаларының сызық SVM жұмысын зерттеп көрдік. Біздің негізгі жүйеміз (GRONINGEN) бағалау бағдарламасының ең жақсы жылдамдығын (87, 56 F1- score) жеткізеді. Тек 1- 9 n- граммды қана мүмкіндіктер ретінде. Біз бұны бірнеше ензембл және мета классификациялармен салыстырып, сызық жүйелік басқалармен біріктіргенде, осымен қатар сызық классификациялармен біріктірілген жүйелік қалай қалай қалады Арнаулы маңызды тақырыпты тақырыпты тақырыпты өзгерту кезіне сұрақ үлестіру үшін қолданылады.Abstract
본고에서 우리는 NLI 공유 임무 2017에서 언어와 무관한 문자 특징 훈련을 바탕으로 하는 선형 지원 벡터기의 성능을 연구했다.우리의 기본 시스템(GRONINGEN)은 1-9자의 n-gram만 특징으로 하여 평가집에서 최상의 성능(87.56 F1 점수)을 실현하였다.우리는 이를 몇 가지 집적 분류기와 원 분류기와 비교하여 선형 시스템과 다른 분류기, 특히 비선형 분류기가 조합될 때의 표현을 검증할 것이다.특히 평가 논문의 즉각적인 배포로 인한 화제 편견이 강조된다.Abstract
Šiame dokumente mes tiriame linijinio SVM, mokomo savarankiškomis kalbos charakteristikomis pagal NLI 2017 m. bendrą užduotį, veiklos rezultatus. Mūsų pagrindinė sistema (GRONINGEN) pasiekia geriausius vertinimo rinkinio rezultatus (87,56 F1 balas), naudojant tik 1–9 ženklų n-gramų savybes. Palyginame tai su keliais komplektais ir metaklasifikatoriais, siekiant išnagrinėti, kaip linijinė sistema veikia derinant su kitais, ypač ne linijiniais klasifikatoriais. Ypatingas dėmesys skiriamas teminei pusiausvyrai, kuri egzistuoja dėl vertinimo egzamino greito paskirstymo.Abstract
Во овој весник ја истражуваме изведбата на линијарен СВМ обучен на јазички независни карактеристики за заедничката задача на НЛИ 2017 година. Нашиот основен систем (GRONINGEN) постигнува најдобра резултат (87,56 F1-оценка) на сетот на оценка користејќи само 1-9 знаци n-грами како карактеристики. Го споредуваме ова со неколку ансембли и метакласификатори со цел да провериме како линијарниот систем се одвива кога се комбинира со други, особено нелинијарни класификатори. Специјален истакнување се става на тематска предраспределба која постои поради брзата дистрибуција на есејот за проценка.Abstract
ഈ പത്രത്തില്, നമ്മള് നിരീക്ഷിക്കുന്നത് ഭാഷ സ്വാതന്ത്രതയുള്ള കാര്യങ്ങളില് പരിശീലിക്കപ്പെട്ട സ്വതന്ത്രമായ എസ്വിഎം പ് നമ്മുടെ അടിസ്ഥാന സിസ്റ്റത്തിന്റെ (GRONINGEN) ഒരു 1-9 അക്ഷരര് n-ഗ്രാമിനെ ഉപയോഗിക്കുന്ന വിലയില് ഏറ്റവും നല്ല പ്രവര്ത്തനങ്ങള് എത്തുന്നു. നമ്മള് ഇത് കുറച്ച് ഇൻസ്പെയിലും മെറ്റാ ക്ലാസ്ഫിഫറുകളുടെയും നേരെ തുല്യമാക്കിയിരിക്കുന്നു. മറ്റുള്ളവരുടെയും പ്രത്യേകിച്ച് ല എസ്സി വിതരണം കൊണ്ട് നിലനില്ക്കുന്ന പ്രധാനപ്പെട്ട കാര്യത്തില് പ്രത്യേക ശ്രദ്ധ നല്കുന്നു.Abstract
Энэ цаасан дээр бид 2017 оны NLI хуваарилагдсан ажлын талаар сургалтын шулуун SVM-ын үйл ажиллагааг судалж байна. Бидний үндсэн систем (GRONINGEN) нь зөвхөн 1-9 дүрсийг n-грамм гэх мэт ашиглан шалгалтын хамгийн сайн үйл ажиллагааг (87.56 F1-score) гаргадаг. Бид үүнийг олон анзамбарт болон мета-классификациудтай харьцуулахын тулд шулууны систем бусад, ялангуяа шулуун бус классификациудтай холбогдох үед хэрхэн алдагддаг талаар шалгаж байна. Үүний шалгалтын эссийн шалгалтын үр дүнд оршиж буй сэдэв дээр онцгой анхаарал татаж байна.Abstract
Dalam kertas ini, kami mengeksplorasi prestasi SVM linear dilatih pada ciri aksara bebas bahasa untuk Tugas Berkongsi NLI 2017. Sistem as as kami (GRONINGEN) mencapai prestasi terbaik (87.56 F1-score) pada set penilaian menggunakan hanya 1-9 aksara n-gram sebagai ciri-ciri. Kita membandingkan ini dengan beberapa ensemble dan meta-klasifikasi untuk memeriksa bagaimana sistem linear berjalan bila digabungkan dengan klasifikasi lain, terutama bukan-linear. Special emphasis is placed on the topic bias that exists by virtue of the assessment essay prompt distribution.Abstract
F’dan id-dokument, a ħna nesploraw il-prestazzjoni ta’ SVM lineari mħarreġ fuq karatteristiċi ta’ karattru indipendenti mil-lingwa għall-Kompitu Konġunt NLI 2017. Our basic system (GRONINGEN) achieves the best performance (87.56 F1-score) on the evaluation set using only 1-9 character n-grams as features. Aħna nqabblu dan ma’ diversi ensemble u meta-klassifikaturi sabiex jeżaminaw kif is-sistema lineari tgħaddi meta kkombinata ma’ klassifikaturi oħra, speċjalment mhux lineari. Qiegħed enfasi speċjali fuq il-preġudizzju tematiku li jeżisti bis-saħħa tad-distribuzzjoni fil-pront tas-sess ta’ valutazzjoni.Abstract
In dit artikel onderzoeken we de prestaties van een lineaire SVM getraind op taalonafhankelijke karakterkenmerken voor de NLI Shared Task 2017. Ons basissysteem (GRONINGEN) bereikt de beste prestaties (87.56 F1-score) op de evaluatieset met slechts 1-9 teken n-gram als kenmerken. We vergelijken dit met verschillende ensemble- en metaclassificatoren om te onderzoeken hoe het lineaire systeem presteert in combinatie met andere, vooral niet-lineaire classificatoren. Bijzondere nadruk wordt gelegd op de topic bias die bestaat uit het assessment essay prompt distributie.Abstract
I denne papiret utforskar vi utviklinga av ein lineær SVM trent på språk uavhengige teiknkonstillingar for NLI delt oppgåve 2017. Vår grunnleggjande system (GRONINGEN) oppnår det beste utviklinga (87,56 F1- poeng) på evalueringsinnstillinga med berre 1- 9 teikn n n- gram som funksjonar. Vi samanliknar dette med fleire ensembler og metaklassifiserar for å undersøke korleis lineære systemet fargar når det kombinerer med andre, spesielt ikkje-lineære klassifiserar. Spesielt oppmerking er plassert på emneformasjonen som eksisterer på grunn av evalueringsessået spørre distribusjon.Abstract
W niniejszym artykule badamy wydajność liniowego SVM przeszkolonego na właściwościach znaków niezależnych od języka dla NLI Shared Task 2017. Nasz podstawowy system (GRONINGEN) osiąga najlepszą wydajność (87,56 F1-wynik) w zestawie oceniającym, używając tylko 1-9 znaków n-gramów jako cech. Porównujemy to z kilkoma zespołami i metaklasyfikatorami, aby zbadać, jak radzi sobie system liniowy w połączeniu z innymi, zwłaszcza nieliniowymi klasyfikatorami. Szczególny nacisk kładzie się na temat stronniczości, która istnieje na podstawie szybkiej dystrybucji eseju oceniającego.Abstract
Neste artigo, exploramos o desempenho de um SVM linear treinado em recursos de caracteres independentes de linguagem para o NLI Shared Task 2017. Nosso sistema básico (GRONINGEN) alcança o melhor desempenho (87,56 F1-score) no conjunto de avaliação usando apenas 1-9 n-gramas de caracteres como recursos. Comparamos isso com vários classificadores de ensemble e metaclassificadores para examinar como o sistema linear se comporta quando combinado com outros classificadores, especialmente não lineares. Ênfase especial é colocada no viés do tópico que existe em virtude da distribuição imediata do ensaio de avaliação.Abstract
În această lucrare, explorăm performanța unui SVM liniar instruit pe caracteristici independente de limbă pentru NLI Shared Task 2017. Sistemul nostru de bază (GRONINGEN) obține cea mai bună performanță (87,56 F1-scor) pe setul de evaluare folosind doar 1-9 caractere n-grame ca caracteristici. Comparăm acest lucru cu mai mulți ansambluri și meta-clasificatori pentru a examina modul în care se descurcă sistemul liniar atunci când este combinat cu alți clasificatori, în special non-liniari. Un accent deosebit este pus pe părtinirea subiectului care există în virtutea distribuției prompte a eseului de evaluare.Abstract
В этой статье мы исследуем производительность линейной виртуальной машины защиты, обученной языковым независимым функциям символов для совместной задачи NLI 2017. Наша базовая система (GRONINGEN) достигает наилучшей производительности (87,56 балла по шкале F1) в наборе оценок, используя только 1-9 символьных n-грамм в качестве характеристик. Мы сравниваем это с несколькими ансамблями и мета-классификаторами, чтобы изучить, как работает линейная система в сочетании с другими, особенно нелинейными классификаторами. Особый акцент делается на предвзятости темы, которая существует в силу быстрого распространения оценочного эссе.Abstract
මේ පත්තරේ අපි පරීක්ෂණය කරන්නේ 2017 NLI සාමාන්ය වැඩක් සඳහා භාෂාව නිදහස් විශේෂිත වර්ගයක් ගැන ලිනියර SVM ක්රි අපේ මූලික පද්ධතිය (GRONINGEN) හොඳම ප්රමාණය (87.56 F1-score) විශේෂණය සඳහා ප්රමාණය සඳහා 1-9 අක්ෂර n-gram විතරයි. අපි මේක සම්පූර්ණය කරන්නේ අනිත් වෙනුවෙන්, විශේෂයෙන් අනිත් විශේෂකයෙන් සම්පූර්ණය නොලිනාර් පද්ධතිය කොහොමද කියල විශේෂ ප්රතිශ්වාසය තියෙන්නේ විශේෂ ප්රතිශ්වාසයේ ප්රතිශ්වාසයේ ප්රතිශ්වාසයේ ප්රතිශAbstract
V tem prispevku raziskujemo zmogljivost linearnega SVM, usposobljenega za jezikovno neodvisne značilnosti za skupno nalogo NLI 2017. Naš osnovni sistem (GRONINGEN) dosega najboljšo zmogljivost (87,56 F1-score) v kompletu ocenjevanja z uporabo samo 1-9 znakov n-gramov kot funkcije. To primerjamo s številnimi ansambli in metaklasifikatorji, da bi preučili, kako deluje linearni sistem v kombinaciji z drugimi, zlasti nelinearnimi klasifikatorji. Poseben poudarek je namenjen tematski pristranskosti, ki obstaja zaradi takojšnje distribucije ocenjevalnega eseja.Abstract
Warqadan waxaynu ka baaraynaa bandhigyada SVM-ka qoran oo lagu baray xaraf xor ah oo luqada ku saabsan shaqo la sharciyey ee NLI 2017. Our basic system (GRONINGEN) achieves the best performance (87.56 F1-score) on the evaluation set using only 1-9 character n-grams as features. Waxaannu isbarbardhignaa qaar ka mid ah fasalka iyo meta-tababarida si aan u baarito sida nidaamka linenka ay u socoto marka la isku darsamo qaar kale, khusuusan fasalka aan linear ahayn. Waxyaabaha gaarka ah waxaa lagu qoraa qeyb-qaybinta qoraalka qiimeynta.Abstract
Në këtë letër, ne eksplorojmë shfaqjen e një SVM linear të trajnuar në karakteristika të pavarura gjuhësh për detyrën e përbashkët të NLI 2017. Sistemi ynë bazë (GRONINGEN) arrin performancën më të mirë (87.56 F1-score) n ë sistemin e vlerësimit duke përdorur vetëm 1-9 karakter n-gram si karakteristika. Ne e krahasojmë këtë me disa ensemble dhe meta-klasifikues me qëllim që të shqyrtojmë se si funksionon sistemi linear kur kombinohet me klasifikues të tjerë, veçanërisht jo-linear. Nënvizim i posaçëm vendoset në paragjykimin e temës që ekziston sipas shpërndarjes së shpejtë të esejës së vlerësimit.Abstract
U ovom papiru istražujemo izvršnost linearnog SVM obučenog na jezičkim nezavisnim karakterskim karakterima za zajednički zadatak NLI 2017. Naš osnovni sistem (GRONINGEN) postiže najbolji rezultat (87,56 F1 rezultat) na procjeni koji koristi samo 1-9 karaktera n-grama kao karakteristike. Uspoređujemo ovo sa nekoliko ensembla i metaklasifikatora kako bi pregledali kako se linearni sistem prodaje kada se kombinira sa drugim, posebno ne-linearnim klasifikatorima. Posebni naglasak je stavljen na temu predrasude koja postoji zbog brzog distribucije eseja procjene.Abstract
I denna uppsats undersöker vi prestandan hos en linjär SVM utbildad på språkoberoende karaktärsfunktioner för NLI Shared Task 2017. Vårt grundläggande system (GRONINGEN) uppnår bästa prestanda (87,56 F1-poäng) på utvärderingen med endast 1-9 tecken n-gram som funktioner. Vi jämför detta mot flera ensemble- och metaklassificerare för att undersöka hur det linjära systemet går i kombination med andra, särskilt icke-linjära klassificerare. Särskild betoning läggs på den ämnesbias som finns på grund av bedömningsuppgiftens prompt distribution.Abstract
Katika gazeti hili, tunachunguza utendaji wa SVM wa msingi ulioelekezwa kwa wahusika huru wa lugha kwa ajili ya kazi ya Shirika la NLI 2017. Mfumo wetu wa msingi (GRONINGEN) unapata ufanisi bora zaidi (score 87.56 F1-score) juu ya tathmini zilizotengenezwa kwa kutumia karatasi 1-9 n-gram tu kama sifa. Tunawalinganisha hili dhidi ya wataalamu kadhaa wa vifaa vya meta ili kutafiti jinsi mfumo wa msingi unavyosafiri wakati wa pamoja na wengine, hususani wachambuzi wasio wa simu. Tatizo maalum imewekwa juu ya upendeleo wa mada unaoendelea kwa sababu ya usambazaji wa mafunzo ya utafiti wa haraka.Abstract
இந்த காகிதத்தில், நாம் NLI பகிர்ந்த செயல் 2017 க்கு பயிற்சி செய்யப்பட்ட மொழி சுதந்திரமான எழுத்து குணங்களின் செயல்பாட்டை த நம்முடைய அடிப்படை அமைப்பு (GRONINGEN) சிறந்த செயல்பாடு (87. 56 F1- score) மதிப்பு அமைப்பில் 1- 9 எழுத்து n- கிராம் மட்டும் தன்மைகளாக பயன்படுத்தும். கோடு வகுப்பாளர்களுடன் மற்றும் குறிப்பிடாத வகுப்பாளர்களுக்கு எதிராக நாம் இதை ஒப்பிடுகிறோம். சிறப்பு குறிப்புகள் விரைவான விபங்கீட்டு மூலம் உள்ள தலைப்பு பிரச்சினைகள் மீது அமைக்கப்படுகிறது.Abstract
Bu kagyzda, 2017-nji NLI Paýlaşy gören üçin çyzgyly SVM täsirini keşfedýäris Biziň esasy sistemimiz (GRONINGEN) deňlenme sisteminde diňe 1-9 karakter n-gramlary üýtgetmek üçin iň gowy performansy çykar. Bunu birçok kadeh ve meta-klasifikatıyla karşılaştırıyoruz ki çizgi sistemin başga bir şekilde çizgi klasifikatörler bilen birleşince nähili farklygyny barlamak üçin deňleşirdik. Ýardam çykmasynyň netijesi ýagdaýynda bar meýdany tertiblenmek üçin häsiýet guruldy.Abstract
اس کاغذ میں، ہم نے NLI شریک ٹاکس 2017 کے لئے زبان کے مستقل شخصیٹ فوائل پر آموزش کی ایک linear SVM کی عملکرد کی تحقیق کی۔ ہماری بنیادی سیسٹم (GRONINGEN) بہترین فعالیت (87.56 F1-score) حاصل کرتی ہے جو محض 1-9 شخصت n-grams کے طور پر استعمال کرتی ہے۔ ہم نے اس کو چند انسمبل اور میٹا-کلاسیر کے ساتھ مقایسہ کیا ہے تاکہ دیکھیں کہ linear system کس طرح فائدہ کرتا ہے جب دوسروں کے ساتھ، مخصوصا غیر-linear classifiers کے ساتھ ملے جاتے ہیں۔ ویسی تسبیح اس موضوع پر رکھی جاتی ہے جو ارزیابی رسی کے ذریعہ موجود ہے کہ تقسیم کے ذریعہ تسبیح تقسیم کرتی ہے.Abstract
Bu hujjatda, biz NLI bilan birlashtirilgan vazifa 2017 uchun tillar xotiraga o'rganilgan SVM tarkibini aniqlamiz. Bizning asosiy tizimmiz (GRONINGEN) faqat 1-9 character n-gram parametrlari sifatida qoʻllanilgan qiymatni bajaradi. Biz buni bir necha misol va meta-klassiflarda kamaytirimiz, boshqa qanday darajalar bilan birlashtirish uchun linear tizimi qanday sodir bo'ladi. @ infoAbstract
Trong tờ giấy này, chúng tôi khám phá khả năng ứng dụng của một SVM tuyến được đào tạo về các tính năng độc lập ngôn ngữ cho công việc chia sẻ NLI AWO7. Hệ thống cơ bản bản bản (giọng phát triển tuyệt nhất) của chúng ta (87.56 F1-số) trên bộ đánh giá, chỉ dùng một ký hiệu 1-9 n-grams như các tính n ăng. Chúng tôi so sánh nó với một số kết hợp và siêu phân loại để kiểm tra giá của hệ thống tuyến tính khi kết hợp với các phân loại khác, đặc biệt là chưa tuyến. Đặc biệt nhấn mạnh vào chủ đề thiên vị hiện hữu nhờ vào việc phân phối bài luận nhanh.Abstract
本文讨论NLI共事2017语言独立字符线性SVM。 吾本(格罗宁根)用1-9个字符之n-gram,估集上最为上(87.56 F1分数)。 比之数成、元分类器,以验线性系统与他类器(尤非线性分类器)合用时也。 特别强调以评估论文及时分发而存者主题偏见。- Anthology ID:
- W17-5043
- Volume:
- Proceedings of the 12th Workshop on Innovative Use of NLP for Building Educational Applications
- Month:
- September
- Year:
- 2017
- Address:
- Copenhagen, Denmark
- Venues:
- BEA | WS
- SIG:
- SIGEDU
- Publisher:
- Association for Computational Linguistics
- Note:
- Pages:
- 382–389
- Language:
- URL:
- https://aclanthology.org/W17-5043
- DOI:
- 10.18653/v1/W17-5043
- Bibkey:
- Cite (ACL):
- Artur Kulmizev, Bo Blankers, Johannes Bjerva, Malvina Nissim, Gertjan van Noord, Barbara Plank, and Martijn Wieling. 2017. The Power of Character N-grams in Native Language Identification. In Proceedings of the 12th Workshop on Innovative Use of NLP for Building Educational Applications, pages 382–389, Copenhagen, Denmark. Association for Computational Linguistics.
- Cite (Informal):
- The Power of Character N-grams in Native Language Identification (Kulmizev et al., 2017)
- Copy Citation:
- PDF:
- https://aclanthology.org/W17-5043.pdf
- Data
- Universal Dependencies
- Terminologies:
Export citation
@inproceedings{kulmizev-etal-2017-power, title = "The Power of Character N-grams in Native Language Identification", author = "Kulmizev, Artur and Blankers, Bo and Bjerva, Johannes and Nissim, Malvina and van Noord, Gertjan and Plank, Barbara and Wieling, Martijn", booktitle = "Proceedings of the 12th Workshop on Innovative Use of {NLP} for Building Educational Applications", month = sep, year = "2017", address = "Copenhagen, Denmark", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/W17-5043", doi = "10.18653/v1/W17-5043", pages = "382--389", }
<?xml version="1.0" encoding="UTF-8"?> <modsCollection xmlns="http://www.loc.gov/mods/v3"> <mods ID="kulmizev-etal-2017-power"> <titleInfo> <title>The Power of Character N-grams in Native Language Identification</title> </titleInfo> <name type="personal"> <namePart type="given">Artur</namePart> <namePart type="family">Kulmizev</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Bo</namePart> <namePart type="family">Blankers</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Johannes</namePart> <namePart type="family">Bjerva</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Malvina</namePart> <namePart type="family">Nissim</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Gertjan</namePart> <namePart type="family">van Noord</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Barbara</namePart> <namePart type="family">Plank</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Martijn</namePart> <namePart type="family">Wieling</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <originInfo> <dateIssued>2017-09</dateIssued> </originInfo> <typeOfResource>text</typeOfResource> <relatedItem type="host"> <titleInfo> <title>Proceedings of the 12th Workshop on Innovative Use of NLP for Building Educational Applications</title> </titleInfo> <originInfo> <publisher>Association for Computational Linguistics</publisher> <place> <placeTerm type="text">Copenhagen, Denmark</placeTerm> </place> </originInfo> <genre authority="marcgt">conference publication</genre> </relatedItem> <identifier type="citekey">kulmizev-etal-2017-power</identifier> <identifier type="doi">10.18653/v1/W17-5043</identifier> <location> <url>https://aclanthology.org/W17-5043</url> </location> <part> <date>2017-09</date> <extent unit="page"> <start>382</start> <end>389</end> </extent> </part> </mods> </modsCollection>
%0 Conference Proceedings %T The Power of Character N-grams in Native Language Identification %A Kulmizev, Artur %A Blankers, Bo %A Bjerva, Johannes %A Nissim, Malvina %A van Noord, Gertjan %A Plank, Barbara %A Wieling, Martijn %S Proceedings of the 12th Workshop on Innovative Use of NLP for Building Educational Applications %D 2017 %8 September %I Association for Computational Linguistics %C Copenhagen, Denmark %F kulmizev-etal-2017-power %R 10.18653/v1/W17-5043 %U https://aclanthology.org/W17-5043 %U https://doi.org/10.18653/v1/W17-5043 %P 382-389
Markdown (Informal)
[The Power of Character N-grams in Native Language Identification](https://aclanthology.org/W17-5043) (Kulmizev et al., 2017)
- The Power of Character N-grams in Native Language Identification (Kulmizev et al., 2017)
ACL
- Artur Kulmizev, Bo Blankers, Johannes Bjerva, Malvina Nissim, Gertjan van Noord, Barbara Plank, and Martijn Wieling. 2017. The Power of Character N-grams in Native Language Identification. In Proceedings of the 12th Workshop on Innovative Use of NLP for Building Educational Applications, pages 382–389, Copenhagen, Denmark. Association for Computational Linguistics.