Text AutoAugment : Learning Compositional Augmentation Policy for Text ClassificationAutoAugment: Learning Compositional Augmentation Policy for Text Classification Teks OutoAugment: Learning Compositional Augmentation Policy for Text Classification ምርጫዎች التعزيز التلقائي للنص: تعلم نهج التعزيز التركيبي لتصنيف النص Metin OtoAugment: Learning Compositional Augmentation Policy for Text Classification Автоувеличение на текста: Учебна политика за композиционно увеличение за класификация на текста টেক্সট স্বয়ংক্রিয়ভাবে অ্যাগ্রাগমেন্ট: টেক্সট ক্লাসিফেশনের জন্য কম্পোটিশনিয়েন্টিয়াল অ্যা ཡི་གེ Autopovećanje teksta: učenje kompozicionalne povećanje politike za klasifikaciju teksta Text AutoAugment: Aprendre política d'augmentació compositiva per a la classificació del text Automatické rozšíření textu: Zásady učení kompozičního rozšíření pro klasifikaci textu Tekst AutoAugment: Læring Compositional Augmentation Policy for tekstklassifikation Text AutoAugment: Learning Compositional Augmentation Policy for Text Classification Αυτόματη αύξηση κειμένου: Μαθαίνοντας πολιτική σύνθετης επέκτασης για την ταξινόμηση κειμένου Text AutoAugment: Política de aumento de la composición de aprendizaje para la clasificación de textos Teksti automaatne lisamine: teksti klassifitseerimise kompositsioonilise lisamise poliitika õppimine AutoAugment: Learning Compositional Augmentation Policy for Text Classification Tekstin automaattinen lisäys: Tekstin luokittelun komposiittinen lisäys -käytäntö Text AutoAugment : Politique d'augmentation compositionnelle d'apprentissage pour la classification de texte Uathmhéadú Téacs: Beartas um Mhéadú Comhdhéanta d'Aicmiú Téacs a Fhoghlaim @ item Text character set Text AutoAugment: Learning Composition Augmentation Policy for Text Classification पाठ स्वत: योग: पाठ वर्गीकरण के लिए रचनात्मक वृद्धि नीति सीखना Autopovećanje teksta: učenje kompozicionalne povećanje politike za klasifikaciju teksta Szöveg automatikus bővítése: A szövegosztályozáshoz szükséges kompozicionális bővítési irányelvek tanulása Auto AutoAugment Teks: Belajar Politik Augmentasi Komposisi untuk Klasifikasi Teks Testo AutoAugment: Apprendimento Compositional Augmentation Policy per la classificazione del testo Text AutoAugment :テキスト分類のための学習構成拡張ポリシー ProgressBar ტექსტის ავტოAugment: Learning Compositional Augmentation Policy for Text Classification МәтінAugment: Learning Compositional Augmentation Policy for Text Classification 텍스트 자동 개선: 텍스트 분류에 사용되는 작성 개선 정책 학습 Text AutoAugment: Learning Composition Augmentation Policy for Text Classification Текст автоматскоAugment: Learning Compositional Augmentation Policy for Text Classification പദാവലിയുടെ സ്വയം ഓഗ്ഗ്മെന്റ്: പഠിക്കുന്ന കോമ്പോണ്ട്ടിഷനേഷന് ആഗ്മെന്റ് പോലീസി Текст АвтоAugment: Learning Compositional Augmentation Policy for Text Classification Comment AutoAugment tat-Test: Politika ta’ Aġġustament Kompożizzjonali għat-Tagħlim għall-Klassifikazzjoni tat-Test Tekst AutoAugment: Leren Compositional Augmentation Policy voor Tekst Classificatie AutoAugment: Learning Compositional Augmentation Policy for Text Classification AutoRozszerzenie tekstu: Uczenie się zasad rozszerzenia kompozycyjnego dla klasyfikacji tekstu Text AutoAugment: Política de Aprendizagem de Aumento Composicional para Classificação de Texto Text AutoAugment: Învățarea politicii de augmentare compozițională pentru clasificarea textelor Текстовое автодополнение: политика обучения композиционному дополнению для классификации текста Auto Samodejno povečanje besedila: pravilnik učenja kompozicijske povečave za klasifikacijo besedila Xuquuqda iskuulka ah: Barashada iskuulka dhameysashada AutoAugment i Tekstit: Mësimi i Politikës së Rritjes Kompozitive për Klasifikimin e Tekstit AutoAugment teksta: Učenje kompozicionalne povećanje politike za klasifikaciju teksta Text AutoAugment: Lärande Compositional Augmentation Policy för textklassificering Authorization of text உரை தானியங்கி ஒப்புக்கொள்: உரை வகைப்படுத்தலுக்கான கொள்கையை கற்றுக்கொண்டுள்ளது Metin Otomatik Gaýşartma: Metin Sözlemek üçin Sözleşmek Politiki öwrenmek Text AutoAugment: Learning Compositional Augmentation Policy for Text Classification Comment Bản nháp văn bản: Học về Chính sách bổ sung tổng hợp cho hạng Văn bản 文本自监察:学文本分类者复合增强之策
Abstract
Data augmentation aims to enrich training samples for alleviating the overfitting issue in low-resource or class-imbalanced situations. Traditional methods first devise task-specific operations such as Synonym Substitute, then preset the corresponding parameters such as the substitution rate artificially, which require a lot of prior knowledge and are prone to fall into the sub-optimum. Besides, the number of editing operations is limited in the previous methods, which decreases the diversity of the augmented data and thus restricts the performance gain. To overcome the above limitations, we propose a framework named Text AutoAugment (TAA) to establish a compositional and learnable paradigm for data augmentation. We regard a combination of various operations as an augmentation policy and utilize an efficient Bayesian Optimization algorithm to automatically search for the best policy, which substantially improves the generalization capability of models. Experiments on six benchmark datasets show that TAA boosts classification accuracy in low-resource and class-imbalanced regimes by an average of 8.8 % and 9.7 %, respectively, outperforming strong baselines.Abstract
Data-vergroot doel doel om uitvoeringsvoorbeelde te ryk om die oorvloedige probleem in lae hulpbron of klas-onbalanse situasies te verminder. Tradisjoneel metodes stel eerste taak-spesifieke operasies soos Sinoniem Substituur, dan voorafstel die ooreenstemmende parameters soos die vervang tempo kunstensies, wat baie vooraf kennis nodig en is vooraf om in die sub-optimum te val. Oorby, die aantal redigeerder operasies is beperk in die vorige metodes, wat die verskeidigheid van die vergroot data verklein en daarom beperk die prestasie verkry. Om die boonste limitasies te oorwin, voorstel ons 'n raamwerk genaamd Teks AutoAugment (TAA) om 'n samenskaplike en leerbare paradigm te stel vir data augmentasie. Ons bekyk 'n kombinasie van verskeie operasies as 'n vergroot beleid en gebruik 'n effektief Bayesian Optimalisasie algoritme om outomaties te soek vir die beste beleid, wat die generellisering kapasiteit van modele beter. Eksperimente op ses benchmarkdatastelle vertoon dat TAA klassifikasie waarskynlik in lae hulpbron en klas-imbalanseerde rejimes deur 'n gemiddelde van 8.8% en 9.7%, respectively, uitvoer sterke basisline.Abstract
የዳታ ማውጣት ተማሪ ምሳሌዎችን ለመጠቀም የሚያስፈልጋል፡፡ የባሕላዊ ሥርዓቶች አስቀድሞ እንደ ሲኒኒም አቀማመጥ እንደሚያስፈልጉ የስራ ምርጫዎችን ያስተካክላሉ፣ ከዚያም እንደተጨማሪው ምርጫዎች በሙሉ እውቀት እንዲያስፈልጋቸው እና ወደ ታች ምርጫው እንዲወድቁ ይታያል፡፡ በተጨማሪም፣ የቀድሞው ማቀናጃ ቁጥር የቀድሞው ሥርዓት ነው፣ የጥያቄውን ጥያቄ አጎድልቷል፡፡ በላይኛው ግንኙነት ለማሸንፋት፣ የጽሑፍ አውቶማቲ (TAA) የተባለውን መፍጠር ለዳታ ማጠቃቀሚያ እና ለማስተማር ተቃውሞ ለመፍጠር እናስጀጋለን፡፡ የተለያዩ አካባቢዎች የፖሊሲ መቆጣጠር እና የባይስያ ምርጫዎችን መግለጫ ማድረግ እናስጠጋለን፡፡ የስድስት benchmark ዳታ ማሳየት TAA ክፍተቶችን በዝቅተኛ resource እና በክፍለ ክፍል ክፍተቶችን በማድረግ 8.8 በመቶ እና 9.7 በመቶ በመጠቀም የበረታች መሠረት ያሳያል፡፡Abstract
تهدف زيادة البيانات إلى إثراء عينات التدريب للتخفيف من مشكلة فرط التجهيز في المواقف منخفضة الموارد أو غير المتوازنة في الفصل. تقوم الطرق التقليدية أولاً باستنباط عمليات خاصة بالمهمة مثل بديل المرادف ، ثم تعيين المعلمات المقابلة مسبقًا مثل معدل الاستبدال بشكل مصطنع ، والتي تتطلب الكثير من المعرفة السابقة وتكون عرضة للوقوع في المستوى دون الأمثل. إلى جانب ذلك ، فإن عدد عمليات التحرير محدود في الطرق السابقة ، مما يقلل من تنوع البيانات المعززة وبالتالي يحد من مكاسب الأداء. للتغلب على القيود المذكورة أعلاه ، نقترح إطارًا يسمى Text AutoAugment (TAA) لإنشاء نموذج تركيبي وقابل للتعلم لزيادة البيانات. نحن نعتبر مجموعة من العمليات المختلفة بمثابة سياسة زيادة ونستخدم خوارزمية Bayesian Optimization الفعالة للبحث تلقائيًا عن أفضل سياسة ، مما يحسن بشكل كبير من قدرة التعميم للنماذج. تُظهر التجارب على ست مجموعات بيانات معيارية أن تحليل المواد الكيميائية يعزز دقة التصنيف في الأنظمة منخفضة الموارد والأنظمة غير المتوازنة في الفئة بمتوسط 8.8٪ و 9.7٪ على التوالي ، متفوقًا على خطوط الأساس القوية.Abstract
Data artırması zənginləndirmək məqsədilə düşük ressurslar və sınıf müəyyən edilmiş durumlarda çox çətin olanı azaltmaq üçün təhsil örnəklərini zənginləndirmək məqsədilədir. İlk dəyişiklik metodlar sinonim yerinə gətirən işlər kimi təhsil-təhsil işləri təyin edir, sonra müəyyən olunan parametroları, bəlkə, əvvəlki bilgi üçün çox lazımdır və altoptim olaraq düşmək üçün hazırlanır. Əvvəlki metodlarda düzəltmə işlərinin sayısı hədəf edilir, ki, artırılmış məlumatların müxtəlifliyini azaldır və bu səbəbdən istifadə edir. Üstündəki sınırları üstün etmək üçün, məlumatları artırmaq üçün kompozisyonlu və öyrənməli bir paradigmu təklif edirik. Biz müxtəlif operasyonların birləşdirilməsini artırma siyasəti kimi hesab edirik və müvəffəqiyyətli Bayesian Optimizasyon algoritmini özünüzə ən yaxşı siyasəti axtarmaq üçün istifadə edirik, bu modellerin generalizasyon qabiliyyətini çox yaxşılaşdırır. Altı benchmark veri qurduğu təcrübələr təcrübələrinə göstərir ki, TAA dəyişiklik dəyişiklik və dəyişiklik dəyişiklik rejimlərin ortalaması 8,8% və 9,7% dəyişiklikdə qüvvətli səhifələrdən üstün olduğunu göstərir.Abstract
Увеличаването на данните има за цел да обогати образците от обучение за облекчаване на проблема с прекомерното приспособяване в ситуации с нисък ресурс или дисбаланс на класа. Традиционните методи първо разработват специфични задачи операции като заместване на синоним, след което предварително задават съответните параметри, като процента на заместване изкуствено, които изискват много предварителни знания и са склонни да попаднат в суб-оптималния. Освен това броят на операциите по редактиране е ограничен в предишните методи, което намалява разнообразието на разширените данни и по този начин ограничава повишаването на производителността. За да преодолеем горепосочените ограничения, предлагаме рамка, наречена Текстово Автоусилване (ААА), за да установим композиционна и научена парадигма за увеличаване на данните. Ние разглеждаме комбинацията от различни операции като политика за увеличаване и използваме ефективен алгоритъм за Байсиева оптимизация за автоматично търсене на най-добрата политика, което значително подобрява способността за обобщаване на моделите. Експериментите върху шест базови набора данни показват, че АТА повишава точността на класификацията при режими с нисък ресурс и дисбалансиран клас със средно 8,8% и 9,7%, надминавайки силните базови линии.Abstract
তথ্য যোগাযোগের উদ্দেশ্য হচ্ছে নিম্ন সম্পদ বা ক্লাসের অসমান পরিস্থিতি কমিয়ে দেওয়ার জন্য প্রশিক্ষণ নমুনা সমৃদ্ধ করার জন্য। ঐতিহ্যবাহী পদ্ধতি প্রথমে কাজ-নির্দিষ্ট অপারেশন যেমন সিনোনিম সাবস্টিটুটেট, তারপর সংশ্লিষ্ট পার্টারেট, যেমন সংশ্লিষ্ট প্রতিস্থাপনের হার কৌতূহলিকভাবে প্র Besides, the number of editing operations is limited in the previous methods, which decreases the diversity of the augmented data and thus restricts the performance gain. উপরের সীমাবদ্ধতা বিজয়ী হওয়ার জন্য আমরা একটি ফ্রেমার্ক প্রস্তাব করছি যার নাম টেক্সট স্বয়ংক্রিয়ভাবে অংশগ্রহণ করা হয়েছে এবং তথ্য যোগায আমরা বিভিন্ন কার্যকলাপের একত্রিত বিভিন্ন নীতি হিসেবে বিবেচনা করি এবং স্বয়ংক্রিয়ভাবে স্বয়ংক্রিয়ভাবে অনুসন্ধানের জন্য এক কার্যকর বেয়েশিয়ান অপেক্ষ ছয়টি বেনম্যার্ক ডাটাসেটের পরীক্ষা দেখা যাচ্ছে যে টায়া নিম্নলিখিত সম্পদ এবং শ্রেণীবিচ্ছিন্ন শাসকদের গুরুত্বপূর্ণ বৃদ্ধি করেছে যে গড়ে ৮.Abstract
ཆེ་རྐྱེན་ཚད་མང་ཙམ་བསྐྱེད་པའི་གཟུགས་རིས་འདིས་ཉར་འཇུག་བྱེད་པའི་དཔེ་དབྱིབས་རྩལ་བསྐྱེད་ཡོང་། Traditional methods first devise task-specific operations such as Synonym Substitute, then preset the corresponding parameters such as the substitution rate artificially, which require a lot of prior knowledge and are prone to fall into the sub-optimum. དེ་ལས་ཀྱང་། ཞུན་དག་བཟོ་བྱས་པའི་བྱ་འགུལ་གྱི་གྲངས་ཀ་དེ་སྔོན་གྱི་ཐབས་ལམ་ནང་དུ་ཚད་གཞི་ཡོད། To overcome the above limitations, we propose a framework named Text AutoAugment (TAA) to establish a compositional and learnable paradigm for data augmentation. ང་ཚོས་རྐྱེན་བཟོ་བྱེད་སྲིད་ཇུས་མཐུན་བཟོ་བྱེད་མི་འདུག་པས་ཕན་ཚུན་འབྲེལ་གྱི་Bayesian Optimization algorithm ས་ལག་ལེན་འཐབ་སྟངས་དང་རང་འགུལ་གྱིས་འཚོལ་བཤེར་བྱེ Experiments on six benchmark datasets show that TAA boosts classification accuracy in low-resource and class-imbalanced regimes by an average of 8.8% and 9.7%, respectively, outperforming strong baselines.Abstract
Povećavanje podataka je cilj obogatiti uzorke obuke za ublažavanje preodgovarajućeg pitanja u situacijama niskih resursa ili niskih različitih klasa. Tradicionalne metode su prvi razmišljale o specifičnim operacijama za zadatak, poput sindonima zamjene, a zatim predstavljaju odgovarajuće parametre poput umjetničke stope zamjene, koje zahtijevaju mnogo prethodnih znanja i prikladno padaju u podoptimum. Osim toga, broj urednih operacija je ograničen u prethodnim metodama, što smanjuje raznolikost povećanih podataka i tako ograničava dobitak učinka. Da bi se nadoknadili iznad ograničenja, predlažemo okvir po imenu Text AutoAugment (TAA) kako bi uspostavili kompozicionalnu i učenu paradigmu za povećanje podataka. Smatramo kombinaciju različitih operacija kao povećanu politiku i iskoristiti efikasan Bayesianski optimizacijski algoritam za automatski potragu za najboljom politikom, što značajno poboljšava sposobnost generalizacije modela. Eksperimenti na šest standardnih podataka pokazuju da je TAA povećala preciznost klasifikacije u nizim resursima i niskim regimima klase u prosjeku od 8,8% i 9,7%, odnosno, nadmašujući jake osnovne linije.Abstract
L'augment de les dades té l'objectiu d'enriquecer mostres d'entrenament per aliviar la qüestió de l'excess en situacions de baix recursos o desequilibris de classe. Traditional methods first devise task-specific operations such as Synonym Substitute, then preset the corresponding parameters such as the substitution rate artificially, which require a lot of prior knowledge and are prone to fall into the sub-optimum. A més, el nombre d'operacions d'edició està limitat en els mètodes anteriors, que redueix la diversitat de les dades augmentates i, així, limita el guany de rendiment. Per superar les limitacions anteriors, proposem un marc anomenat Text AutoAugment (TAA) per establir un paradigm a compositiu i aprensible per augmentar les dades. Considerem una combinació de diverses operacions com una política de augmentació i utilitzem un algoritme eficient d'optimització bayèsia per buscar automàticament la millor política, que millora substancialment la capacitat de generalització dels models. Els experiments de sis conjunts de dades de referència demostren que la TAA augmenta la precisió de classificació en règims de baix recursos i desequilibris de classe en una mitjana d'8,8% i 9,7%, respectivament, superant les línies de base fortes.Abstract
Účelem rozšíření dat je obohacení vzorků školení pro zmírnění problému nadměrného vybavení v situacích s nízkými zdroji nebo nerovnováhou tříd. Tradiční metody nejprve navrhují operace specifické pro úkoly, jako je Synonym Substitute, poté uměle přednastavují odpovídající parametry, například rychlost substituce, které vyžadují mnoho předchozích znalostí a jsou náchylné spadnout do suboptimálu. Kromě toho je počet editačních operací omezen v předchozích metodách, což snižuje diverzitu rozšířených dat a tím omezuje zisk výkonu. Pro překonání výše uvedených omezení navrhujeme rámec s názvem Text AutoAugment (TAA), který vytvoří kompoziční a naučitelné paradigma pro rozšíření dat. Kombinaci různých operací považujeme za rozšíření politiky a využíváme efektivní Bayesovský optimalizační algoritmus k automatickému vyhledávání nejlepší politiky, což podstatně zlepšuje generalizační schopnost modelů. Experimenty na šesti referenčních datových souborech ukazují, že TAA zvyšuje přesnost klasifikace v režimech s nízkými zdroji a režimech nerovnováhy tříd o průměr 8,8% a 9,7% a překonává silné základní linie.Abstract
Dataforøgelse har til formål at berige træningsprøver for at afhjælpe problemet med overtilpasning i situationer med lav ressource eller klasse-ubalance. Traditionelle metoder udtænker først opgavespecifikke operationer såsom Synonym Substitute, derefter forudindstiller de tilsvarende parametre såsom substitutionshastigheden kunstigt, som kræver en masse forudgående viden og er tilbøjelige til at falde ind i det suboptimale. Desuden er antallet af redigeringsoperationer begrænset i de tidligere metoder, hvilket mindsker mangfoldigheden af de forstærkede data og dermed begrænser ydeevnegevinsten. For at overvinde ovenstående begrænsninger foreslår vi en ramme kaldet Tekst AutoAugment (TAA) for at etablere et kompositionelt og lærbart paradigme for dataaugmentation. Vi betragter en kombination af forskellige operationer som en augmentation politik og bruger en effektiv Bayesian Optimization algoritme til automatisk at søge efter den bedste politik, hvilket væsentligt forbedrer generaliseringskapaciteten af modeller. Eksperimenter med seks benchmarkdatasæt viser, at TAA øger klassificeringsnøjagtigheden i lav ressource- og klassebalancerede regimer med et gennemsnit på henholdsvis 8,8% og 9,7%, hvilket overgår stærke basislinjer.Abstract
Data Augmentation zielt darauf ab, Trainingsproben anzureichern, um das Problem der Überanpassung in ressourcenarmen oder klassenungleichgewichtigen Situationen zu lindern. Traditionelle Methoden konzipieren zunächst aufgabenspezifische Operationen wie Synonym Substitute, setzen dann die entsprechenden Parameter wie die Substitutionsrate künstlich vor, die viel Vorwissen erfordern und anfällig sind, ins Suboptimum zu fallen. Außerdem ist die Anzahl der Bearbeitungsvorgänge in den bisherigen Methoden begrenzt, was die Diversität der erweiterten Daten verringert und somit den Leistungszuwachs einschränkt. Um die oben genannten Einschränkungen zu überwinden, schlagen wir ein Framework namens Text AutoAugment (TAA) vor, um ein kompositorisches und lernfähiges Paradigma für die Datenaugmentation zu etablieren. Wir betrachten eine Kombination verschiedener Operationen als Augmentationspolitik und verwenden einen effizienten Bayesischen Optimierungsalgorithmus, um automatisch nach der besten Richtlinie zu suchen, was die Generalisierungsfähigkeit von Modellen erheblich verbessert. Experimente an sechs Benchmark-Datensätzen zeigen, dass TAA die Klassifizierungsgenauigkeit in ressourcenarmen und klassenungleichgewichtigen Regimen um 8,8% bzw. 9,7% erhöht und starke Baselines übertrifft.Abstract
Η αύξηση δεδομένων αποσκοπεί στον εμπλουτισμό των δειγμάτων κατάρτισης για την ανακούφιση του προβλήματος υπερπροσαρμογής σε καταστάσεις χαμηλού δυναμικού ή ανισορροπίας τάξεων. Οι παραδοσιακές μέθοδοι αρχικά επινοούν συγκεκριμένες εργασίες όπως το Συνώνυμο υποκατάστατο, στη συνέχεια προκαθορίζουν τεχνητά τις αντίστοιχες παραμέτρους, όπως το ποσοστό υποκατάστασης, οι οποίες απαιτούν πολλές γνώσεις και είναι επιρρεπείς να πέσουν στο υποβέλτιστο. Εκτός αυτού, ο αριθμός των εργασιών επεξεργασίας είναι περιορισμένος στις προηγούμενες μεθόδους, γεγονός που μειώνει την ποικιλομορφία των ενισχυμένων δεδομένων και συνεπώς περιορίζει το κέρδος απόδοσης. Για να ξεπεραστούν οι παραπάνω περιορισμοί, προτείνουμε ένα πλαίσιο που ονομάζεται Αυτόματη Αύξηση Κειμένου (ΤΑΑ) για να καθιερωθεί ένα σύνθετο και μαθησιακό παράδειγμα για την αύξηση δεδομένων. Θεωρούμε έναν συνδυασμό διαφόρων λειτουργιών ως πολιτική αύξησης και χρησιμοποιούμε έναν αποτελεσματικό αλγόριθμο βελτιστοποίησης για την αυτόματη αναζήτηση της καλύτερης πολιτικής, η οποία βελτιώνει σημαντικά την ικανότητα γενικοποίησης των μοντέλων. Τα πειράματα σε έξι σύνολα δεδομένων αναφοράς δείχνουν ότι η ΤΑΑ αυξάνει την ακρίβεια ταξινόμησης σε καθεστώτα χαμηλού δυναμικού και ανισορροπίας κλάσης κατά μέσο όρο 8,8% και 9,7%, αντίστοιχα, και ξεπερνά τις ισχυρές γραμμές βάσης.Abstract
El aumento de datos tiene como objetivo enriquecer las muestras de capacitación para aliviar el problema del sobreajuste en situaciones de bajos recursos o de desequilibrio de clase. Los métodos tradicionales primero diseñan operaciones específicas de la tarea, como Sustitución de sinónimos, y luego preestablecen los parámetros correspondientes, como la tasa de sustitución de forma artificial, que requieren mucho conocimiento previo y son propensos a caer en el subóptimo. Además, el número de operaciones de edición está limitado en los métodos anteriores, lo que reduce la diversidad de los datos aumentados y, por lo tanto, restringe la ganancia de rendimiento. Para superar las limitaciones anteriores, proponemos un marco denominado Text AutoAugment (TAA) para establecer un paradigma de composición y aprendizaje para el aumento de datos. Consideramos una combinación de varias operaciones como una política de aumento y utilizamos un algoritmo de optimización bayesiana eficiente para buscar automáticamente la mejor política, lo que mejora sustancialmente la capacidad de generalización de los modelos. Los experimentos en seis conjuntos de datos de referencia muestran que el TAA aumenta la precisión de la clasificación en los regímenes de bajos recursos y con desequilibrio de clase en un promedio del 8,8 y el 9,7%, respectivamente, superando los sólidos valores de referencia.Abstract
Andmete täiendamise eesmärk on rikastada koolitusnäiteid, et leevendada ülemäärase varustuse probleemi vähese ressursi või klasside tasakaalustamatuse olukordades. Traditsioonilised meetodid töötavad esmalt välja ülesandespetsiifilised toimingud, näiteks sünonüümi asendamine, seejärel seadistavad vastavad parameetrid, näiteks asendamise määr kunstlikult, mis nõuavad palju eelnevaid teadmisi ja langevad kalduvalt suboptimaalsesse. Lisaks on eelmistes meetodites redigeerimistoimingute arv piiratud, mis vähendab laiendatud andmete mitmekesisust ja seega piirab jõudluse suurenemist. Eespool nimetatud piirangute ületamiseks pakume välja raamistiku nimega Text AutoAugment (TAA), et luua andmete suurendamiseks kompositsiooniline ja õppitav paradigma. Me peame erinevate operatsioonide kombinatsiooni suurenduspoliitikaks ja kasutame efektiivset Bayesi optimeerimise algoritmi, et automaatselt otsida parimat poliitikat, mis oluliselt parandab mudelite üldistamisvõimet. Kuue võrdlusandmekogumiga tehtud katsed näitavad, et TAA suurendab klassifitseerimise täpsust väikeste ressursside ja klasside tasakaalustamatuse korra puhul vastavalt keskmiselt 8,8% ja 9,7%, ületades tugevaid lähtetasemeid.Abstract
افزایش دادهها هدف دارند که نمونههای آموزش پولداری را برای کمتر کردن مسئلهی زیادی در موقعیتهای منابع کم یا نابرابری کلاس داشته باشند. روشهای سنتی اول عملیات ویژهای مثل جایگزینی سنونیم را تغییر میدهد، سپس پارامترهای متفاوتی مانند نرخ جایگزینی مصنوعی را پیشفرض کنید، که نیاز به زیر دانش پیشفرض میکنند و به زیر optimum میافتند. علاوه بر این، تعداد عملیات تغییر کردن در روش های قبلی محدود است، که مختلف داده های افزایش شده را کاهش میدهد و به همین دلیل پیروزی عملیات را محدود میکند. برای تغییر محدودیت بالا، ما یک چهارچوب به نام متن AutoAugment (TAA) پیشنهاد میکنیم تا یک پارادیگ ترکیب و یادگیری برای افزایش دادهها را ایجاد کند. ما یک ترکیب عملیات مختلف را به عنوان سیاست افزایش می بینیم و یک الگوریتم فعالیت بایزی برای جستجوی بهترین سیاست را استفاده می کنیم که به طور کامل توانایی عمومی مدل را بهتر می کند. تجربههایی روی شش مجموعههای دادههای مقدار نشان میدهند که TAA دقیقات classification in low-resource and class-imbalanced regimes با متوسط ۸.۸% و ۹.۷%, respectively، بیشتر از خطهای پایههای قوی بیشتر است.Abstract
Datan lisäämisellä pyritään rikastuttamaan koulutusnäytteitä, joilla voidaan lievittää ylikuormitusongelmaa vähäresurssisissa tai luokkaepätasapainoisissa tilanteissa. Perinteiset menetelmät kehittävät ensin tehtäväkohtaisia toimintoja, kuten Synonyme Substitute, ja sitten esimäärittävät vastaavat parametrit, kuten korvaavuusaste keinotekoisesti, jotka vaativat paljon ennakkotietoa ja ovat alttiita putoamaan alioptimaaliseen. Lisäksi muokkaustoimintojen määrä on edellisissä menetelmissä rajallinen, mikä vähentää lisätyn datan monimuotoisuutta ja rajoittaa siten suorituskykyä. Edellä mainittujen rajoitusten voittamiseksi ehdotamme viitekehystä nimeltä Text AutoAugment (TAA), joka luo kompositionaalisen ja opittavan paradigman datan lisäämiseen. Pidämme erilaisten toimintojen yhdistämistä lisäpolitiikkana ja hyödynnämme tehokasta Bayesian Optimization -algoritmia parhaan käytännön automaattiseen etsimiseen, mikä parantaa merkittävästi mallien yleistymiskykyä. Kuuden vertailuaineiston kokeet osoittavat, että TAA parantaa luokitustarkkuutta vähävaraisissa järjestelmissä keskimäärin 8,8% ja luokkaepätasapainoisissa järjestelmissä 9,7%, mikä ylittää vahvat lähtöarvot.Abstract
L'augmentation des données vise à enrichir les échantillons de formation afin de résoudre le problème de suréquipement dans les situations de faible ressources ou de déséquilibre de classe. Les méthodes traditionnelles conçoivent d'abord des opérations spécifiques à une tâche, telles que Synonym Substitute, puis prédéfinissent artificiellement les paramètres correspondants tels que le taux de substitution, qui nécessitent beaucoup de connaissances préalables et sont susceptibles de tomber dans le sous-optimal. En outre, le nombre d'opérations d'édition est limité dans les méthodes précédentes, ce qui réduit la diversité des données augmentées et limite ainsi le gain de performance. Pour surmonter les limitations ci-dessus, nous proposons un cadre nommé Text AutoAugment (TAA) pour établir un paradigme compositionnel et apprenant pour l'augmentation des données. Nous considérons la combinaison de diverses opérations comme une politique d'augmentation et utilisons un algorithme d'optimisation bayésienne efficace pour rechercher automatiquement la meilleure politique, ce qui améliore considérablement la capacité de généralisation des modèles. Des expériences sur six ensembles de données de référence montrent que le TAA augmente la précision de la classification dans les régimes à faibles ressources et déséquilibrés de classe d'une moyenne de 8,8 % et 9,7 %, respectivement, surpassant les bases solides.Abstract
Tá sé mar aidhm ag méadú sonraí samplaí oiliúna a shaibhriú chun an tsaincheist maidir le rófheisteas a mhaolú i gcásanna a bhfuil acmhainní ísle acu nó i gcásanna neamhchothromaithe ranga. Ceapann modhanna traidisiúnta oibríochtaí tasc-shonracha ar nós Ionadaí Comhchiallaigh, ansin déanann siad na paraiméadair chomhfhreagracha ar nós an ráta ionadaíochta a réamhshocrú go saorga, a éilíonn go leor réamheolais agus atá seans maith go dtitfidh siad isteach sa bhfo-optamach. Ina theannta sin, tá líon na n-oibríochtaí eagarthóireachta teoranta sna modhanna roimhe seo, rud a laghdaíonn éagsúlacht na sonraí méadaithe agus a chuireann srian ar an ngnóthachan feidhmíochta. Chun na teorainneacha thuas a shárú, molaimid creat darb ainm Text AutoAugment (TAA) chun paraidím comhdhéanaimh agus infhoghlama a bhunú chun sonraí a mhéadú. Breathnaímid ar chomhcheangal d’oibríochtaí éagsúla mar bheartas méadaithe agus úsáidimid algartam éifeachtach Optamaithe Bayesian chun cuardach a dhéanamh go huathoibríoch ar an mbeartas is fearr, rud a chuireann go mór le cumas ginearálaithe na samhlacha. Léiríonn turgnaimh ar shé thacar sonraí tagarmhairc go neartaíonn TAA cruinneas aicmithe i réimis íseal-acmhainne agus réimis éagothroime aicme 8.8% agus 9.7%, faoi seach, ar an meán, ag comhlíonadh bonnlínte láidre.Abstract
Ƙaraɗawa data na aimakin ya riki misãlai na umarni dõmin ya sauƙaƙara masu sakan da za'a iya haɗa shi cikin halin da ya yi inganci na-resource ko kuma ma'abun-daraja. Tsarin da ya kiyaye ta farkon yana ƙayyade aikin-ƙayyade masu amfani da kamar Tsarin Signom, sa'an nan ka zaɓe parameteri da mai daidaita kamar shirin baddalawa da kima da hannayen, da kuma yana buƙata masu yawa da ilmi a gaba ɗaya, kuma za'a iya ƙara cikin buƙatan-Optin. Babu, ana ƙunsa da yawan aikin editori cikin metodin da aka gaba, wannan yana ƙarantar da baƙaƙƙin data da aka ƙara kuma yana ƙunsa da amfani da fasarin. Za iya rinjãye tsarin da ke saman a kanta, za mu buƙata wani firam wanda aka suna Mataimakin Hujjar (TAA) dõmin a sami wata paradigm da za'a sanar da wa ƙaramaɗar data. We regard a combination of various operations as an augmentation policy and utilize an efficient Bayesian Optimization algorithm to automatically search for the best policy, which substantially improves the generalization capability of models. Tajararin da ke kan data na bangon 6 na nuna cewa TAA yana boost classifikanci tsari cikin mutane na ƙasan-resource da na-balanced, kuma yana tafiyar da gwargwadon jama'a 8.8% da 9.7%, mai cika bazalin ƙarfi.Abstract
שיעור נתונים מתכוון לעשיר דגימות אימון על מנת להקל את בעיית התאמה הגבוהה במצבים עם משאבים נמוכים או לא מאוזנים בכיתה. שיטות מסורתיות מתכננות קודם פעולות מסוימות למשימות, כמו מחליף סינונים, ואז מתקן את הפרמטרים המתאימים כמו קצב החליפה באופן מלאכותי, אשר דורש הרבה ידע קודם והם נוטים ליפול לתוך הת-אופטימום. חוץ מזה, מספר מבצעי העורה מוגבל בשיטות הקודמות, מה שמפחית את מגוון הנתונים המוגברים ולכן מגביר את הרווח ביצועים. כדי להתגבר על הגבלות העליונה, אנו מציעים מסגרת בשם Text AutoAugment (TAA) כדי לקבוע פרדיגמה מורכבת וללמדת לגבירת נתונים. אנחנו מחשיבים שילוב של מבצעים שונים כמדיניות גידול ולהשתמש באלגוריתם אופטימציה בייזי יעיל כדי לחפש באופן אוטומטי את המדיניות הטובה ביותר, אשר משפר באופן משמעותי את יכולת הגנרליזציה של דוגמנים. ניסויים על שישה קבוצות נתונים רמזים מראים שTAA מגביר את מדויקת הסיווג במשטרות עם משאבים נמוכים ובמערכות לא מאוזנות בכיתה בממוצע של 8.8% ול9.7%, בהתאם, מעליים את קווי הבסיס חזקים.Abstract
डेटा संवर्धन का उद्देश्य कम संसाधन या वर्ग-असंतुलित स्थितियों में ओवरफिटिंग मुद्दे को कम करने के लिए प्रशिक्षण नमूनों को समृद्ध करना है। पारंपरिक तरीके पहले कार्य-विशिष्ट संचालन जैसे पर्यायवाची विकल्प तैयार करते हैं, फिर कृत्रिम रूप से प्रतिस्थापन दर जैसे संबंधित मापदंडों को पूर्वनिर्धारित करते हैं, जिसके लिए बहुत सारे पूर्व ज्ञान की आवश्यकता होती है और उप-इष्टतम में गिरने की संभावना होती है। इसके अलावा, संपादन संचालन की संख्या पिछले तरीकों में सीमित है, जो संवर्धित डेटा की विविधता को कम करती है और इस प्रकार प्रदर्शन लाभ को प्रतिबंधित करती है। उपर्युक्त सीमाओं को दूर करने के लिए, हम डेटा वृद्धि के लिए एक रचनात्मक और सीखने योग्य प्रतिमान स्थापित करने के लिए टेक्स्ट ऑटोऑगमेंट (टीएए) नामक एक रूपरेखा का प्रस्ताव करते हैं। हम एक वृद्धि नीति के रूप में विभिन्न संचालनों के संयोजन को मानते हैं और स्वचालित रूप से सर्वश्रेष्ठ नीति की खोज करने के लिए एक कुशल बायेसियन ऑप्टिमाइज़ेशन एल्गोरिथ्म का उपयोग करते हैं, जो मॉडल की सामान्यीकरण क्षमता में काफी सुधार करता है। छह बेंचमार्क डेटासेट पर प्रयोगों से पता चलता है कि टीएए कम-संसाधन और वर्ग-असंतुलित शासनों में वर्गीकरण सटीकता को क्रमशः 8.8% और 9.7% के औसत से बढ़ाता है, मजबूत बेसलाइन को पीछे छोड़ देता है।Abstract
Povećavanje podataka je cilj obogatiti uzorke obuke za ublažavanje preodgovarajućeg pitanja u situacijama niskih resursa ili niskih različitih klasa. Tradicionalne metode prvo izrađuju posebne operacije za zadatak poput sindonima zamjene, a zatim predstavljaju odgovarajuće parametre poput umjetničke stope zamjene, koje zahtijevaju mnogo prethodnih znanja i prikladno padaju u podoptimum. Osim toga, broj redakcijskih operacija ograničen je u prethodnim metodama, što smanjuje raznolikost povećanih podataka i tako ograničava dobitak učinka. Da bi se nadoknadili iznad ograničenja, predlažemo okvir po imenu Text AutoAugment (TAA) za uspostavljanje kompozicionalne i učenje paradigme za povećanje podataka. Smatramo kombinaciju različitih operacija kao povećanje politike i koristimo učinkovit Bayesian Optimizacijski algoritam za automatski potragu za najboljom politikom, što značajno poboljšava sposobnost generalizacije modela. Eksperimenti na šest standardnih podataka pokazuju da je TAA povećala preciznost klasifikacije u nizim resursima i niskim regimima klase u prosjeku od 8,8% i 9,7%, odnosno, nadmašujući jake osnovne linije.Abstract
Az adatbővítés célja, hogy gazdagítsa a képzési mintákat, hogy enyhítse a túlteljesítő problémát alacsony erőforrással rendelkező vagy osztály-kiegyensúlyozatlan helyzetekben. A hagyományos módszerek először feladatspecifikus műveleteket dolgoznak ki, mint például a Synonym Substitute, majd mesterségesen beállítják a megfelelő paramétereket, mint például a helyettesítési arányt, amelyek sok előzetes ismeretet igényelnek, és hajlamosak a szuboptimális értékbe esni. Emellett az előző módszerekben korlátozott a szerkesztési műveletek száma, ami csökkenti a kiterjesztett adatok sokféleségét és így korlátozza a teljesítménynövekedést. A fenti korlátok leküzdése érdekében javasoljuk a Text AutoAugment (TAA) elnevezésű keretrendszert, amely az adatbővítés kompozíciós és tanulható paradigmáját hozza létre. A különböző műveletek kombinációját kiterjesztési politikának tekintjük, és egy hatékony bayesiai optimalizálási algoritmust használunk a legjobb irányelvek automatikus keresésére, ami lényegesen javítja a modellek általánosítási képességét. Hat referenciaadatkészleten végzett kísérletek azt mutatják, hogy a TAA átlagosan 8,8%-kal, illetve 9,7%-kal növeli az osztályozási pontosságot az alacsony erőforrásokkal rendelkező, illetve az osztályok egyensúlyhiányával rendelkező rendszerekben.Abstract
Տվյալների աճը նպատակն է հարստացնել ուսուցման նմուշները, որպեսզի նվազեցնենք գերահարմարեցման խնդիրը ցածր ռեսուրսների կամ դասի անհավասարակշռությունների դեպքում: Առաջին հերթին ավանդական մեթոդները ստեղծում են խնդիրների մասնավոր գործողություններ, ինչպիսիք են Սինոնիմ Փոխարիտը, հետո նախասահմանում են համապատասխան պարամետրերը, ինչպիսիք են, օրինակ, փոխարինման արագությունը, որոնք պահանջում են նախկին շատ գիտելիքներ և հակ Ավելին, խմբագրման գործողությունների թիվը սահմանափակված է նախորդ մեթոդներում, ինչը նվազեցնում է աճեցված տվյալների բազմազանությունը և այսպես սահմանափակում է արդյունավետության շահույթը: Առաջին սահմանափակումներին հաղթահարելու համար մենք առաջարկում ենք մի շրջանակ, որը կոչվում է Text AutoAument (ՏԱԱ), որպեսզի ստեղծվի տվյալների աճի բաղադրական և սովորելի պարադիգմ: We regard a combination of various operations as an augmentation policy and utilize an efficient Bayesian Optimization algorithm to automatically search for the best policy, which substantially improves the generalization capability of models. Վեց համեմատական տվյալների համակարգերի փորձարկումները ցույց են տալիս, որ ՏԱԱ-ն բարձրացնում է դասակարգման ճշգրիտությունը ցածր ռեսուրսների և դասակարգման անհավասարակշռությունների ընթացքում միջինում 8.8 տոկոսով և 9.7 տոկոսով, առավել ուժեղAbstract
Peningkatan data bertujuan untuk memperkaya sampel pelatihan untuk mengurangi masalah overfitting dalam situasi yang tidak seimbang dengan sumber daya rendah atau kelas. Metode tradisional pertama merencanakan operasi spesifik tugas seperti Substitute Sinonim, kemudian mempreset parameter yang cocok seperti kadar substitusi secara seniman, yang membutuhkan banyak pengetahuan sebelumnya dan cenderung untuk jatuh ke sub-optimum. Selain itu, jumlah operasi penyuntingan terbatas dalam metode sebelumnya, yang mengurangi kebanyakan data yang ditambah dan oleh itu mengurangi keuntungan prestasi. To overcome the above limitations, we propose a framework named Text AutoAugment (TAA) to establish a compositional and learnable paradigm for data augmentation. Kami mempertimbangkan kombinasi dari berbagai operasi sebagai kebijakan peningkatan dan menggunakan algoritma Optimisasi Bayesia yang efisien untuk secara otomatis mencari kebijakan terbaik, yang pada dasarnya meningkatkan kemampuan generalisasi model. Eksperimen pada enam set data benchmark menunjukkan bahwa TAA meningkatkan akurasi klasifikasi dalam resime sumber daya rendah dan ketidakseimbangan kelas dengan rata-rata 8,8% dan 9,7%, respectively, melebihi garis dasar yang kuat.Abstract
L'aumento dei dati mira ad arricchire i campioni di formazione per alleviare il problema dell'eccessivo adattamento in situazioni a basso contenuto di risorse o squilibrio di classe. I metodi tradizionali prima concepiscono operazioni specifiche per attività come Synonym Substitute, quindi preimpongono artificialmente i parametri corrispondenti come il tasso di sostituzione, che richiedono molta conoscenza preliminare e sono inclini a cadere nel sub-ottimale. Inoltre, il numero di operazioni di modifica è limitato nei metodi precedenti, il che riduce la diversità dei dati aumentati e quindi limita il guadagno di prestazioni. Per superare le limitazioni di cui sopra, proponiamo un framework denominato Text AutoAugment (TAA) per stabilire un paradigma compositivo e imparabile per l'aumento dei dati. Consideriamo una combinazione di varie operazioni come una politica di aumento e utilizziamo un efficiente algoritmo di ottimizzazione bayesiana per cercare automaticamente la migliore politica, che migliora notevolmente la capacità di generalizzazione dei modelli. Esperimenti su sei set di dati di riferimento mostrano che TAA migliora l'accuratezza della classificazione nei regimi a basso contenuto di risorse e di classe con una media rispettivamente dell'8,8% e del 9,7%, superando le linee di base forti.Abstract
データ拡張は、低資源またはクラスバランスの取れていない状況でのオーバーフィッティングの問題を緩和するためのトレーニングサンプルを充実させることを目的としています。 従来のメソッドは、まず代名詞置換などのタスク固有の操作を考案し、次に人為的に置換率などの対応するパラメータを事前に設定します。これには多くの事前知識が必要であり、サブ最適化に陥りやすいです。 また、従来の方法では編集操作の回数が制限されており、拡張データの多様性が低下し、パフォーマンスの向上が制限される。 上記の限界を克服するために、データ拡張のための構成的で学習可能なパラダイムを確立するために、テキスト自動拡張( TAA )という名前のフレームワークを提案します。 様々な操作の組み合わせを拡張ポリシーとみなし、効率的なベイズ最適化アルゴリズムを利用して最適なポリシーを自動的に検索し、モデルの一般化能力を大幅に向上させます。 6つのベンチマークデータセットに関する実験は、TAAが、低リソース及びクラス不均衡レジメンにおける分類精度をそれぞれ平均8 . 8 %及び9 . 7 %増加させ、強力なベースラインを上回ることを示す。Abstract
Go Ngawe Traditional Methods first use task-special operations like biasane, dadi sing dibenakake perusahaan nggawe ing sampek dadi sing berarti dadi nggawe text Awak dhéwé éntukno sistem sing sampeyan karo akeh operasi nganggo sistem anyar neng sistem anyar nggawe barang yang gagasar bayesi Optimisation NameAbstract
Data augmentation aims to enrich training samples for alleviating the overfitting issue in low-resource or class-imbalanced situations. ტრადიციონალური მეტოვები პირველად განსაზღვრებულია რაოდენობის განსაზღვრებული операциები, როგორც სინონიმური შეცვალობა, და შემდეგ შესაძლებელი პარამეტრები, როგორც შეცვალობა სინამდვილეში, რომლებიც უნდა მ დამატებით, რედაქტირების პარამეტრების რაოდენობა უფრო დაფარდება წინა მეტისებში, რომელიც აზრუმენტირებული მონაცემების განსხვავებას შემცირებს და ამიტომ შემცირებული ჩვენ დავიწყებთ უფრო მეტი ზემოდულებების გადარჩენისთვის ტექსტის ავტოAugment (TAA) სახელი, რომ მონაცემების აზექტირებისთვის კომპოზიციონალური და სწავლილი პარადიგმი ჩვენ განსხვავებული პროგრამების კომბინეციაცია როგორც აგეგენტაციის პოლიტიკა და გამოყენებთ ეფექტიური ბაეზიანის ოპტიმიზაციის ალგორიტიმი, რომ ავტომატურად უკეთესი პოლიტიკის ძებნა, რო ექვსი ბენქმარკის მონაცემების გამოცდილებები აჩვენებს, რომ TAA კლასიფიკაციის წარმოდგენება კლასიფიკაციის წარმოდგენებაში და კლასის განბალანსულებული რეზიმებში, განმავლობით 8,8% და 9,7%-ის განმავლობით, უAbstract
Деректерді көбейту мақсаттары көбейту үшін бақылау үлгілерін көбейту үшін көмектесетін мәселелерді төмен ресурстар немесе класс дисбалансияланған мәселелерде көбейту Дәстүрлі әдістер біріншіден тапсырманың ерекше әрекеттерін, мысалы Синоним алмастыру әрекеттерін құрып, содан кейін келесі параметрлерді, мысалы, алмастыру жиілігін өзгерту жиілігін өзгертіп, алдындағы бі Сонымен қатар, өңдеу операцияларының саны алдыңғы әдістерде шектелген, бұл көбейтілген деректердің әртүрлігін азайтады, сондықтан жылдамдығын шектеп береді. Жоғардағы шектерді көтеру үшін мәтін автоAugment (TAA) деп аталатын фреймді деректерді көтеру үшін композиционалық және оқылмайтын парадигмін құру үшін ұсынамыз. Біз әртүрлі операцияларды көбейту ережесі ретінде біріктіріп, ең жақсы ережелерді автоматты түрде іздеу үшін бейезиялық оптимизациялау алгоритмін қолданамыз. Бұл үлгілердің жалпы көмектесу мүмкінд Алты бағдарламалық деректер қорларының тәжірибесі, ТАА бағдарламалық ресурстар және класс дибалансировалған режимдерінің орташа 8,8% және 9,7% дегенді көрсетеді.Abstract
데이터 확충은 자원 부족이나 학급 불균형 상황에서 과도한 의합 문제를 완화하기 위해 훈련 견본을 풍부하게 하는 데 목적을 두고 있다.전통적인 방법은 먼저 동의어 교체 등 특정한 임무 조작을 설계한 다음에 인위적으로 교체율 등 상응하는 매개 변수를 설정한다. 이것은 대량의 선험 지식을 필요로 하기 때문에 차우에 빠지기 쉽다.또한 이전의 방법에서 편집 조작의 수량이 제한되어 데이터의 다양성을 강화하고 성능의 이득을 제한했다.이러한 한계를 극복하기 위해 우리는 텍스트 자동 증강(Text AutoAugment, TAA)이라는 프레임워크를 제시하여 조합 가능하고 학습 가능한 데이터 증강의 범례를 세웠다.우리는 각종 조작의 조합을 일종의 강화 전략으로 간주하고 효율적인 베일스 최적화 알고리즘을 이용하여 자동으로 최상의 전략을 검색함으로써 모델의 범위화 능력을 크게 향상시켰다.6개 기준 데이터 집합에서의 실험에 따르면 TAA는 저자원과 클래스 불균형 상태에서의 분류 정확도가 각각 평균 8.8%와 9.7% 높아져 강기선보다 우수하다.Abstract
Duomenų didinimo tikslas – praturtinti mokymo mėginius, kad būtų galima sumažinti pertekliaus įrengimo problemą esant mažai išteklių arba klasių disbalansui. Tradiciniai metodai pirmiausia sukuria konkrečias užduotis, pavyzdžiui, Sinonimo pakaitalą, tada iš anksto nustato atitinkamus parametrus, pavyzdžiui, pakeitimo greitį dirbtinai, dėl kurių reikia daug išankstinių žinių ir kurie greičiausiai patenka į suboptimalų. Be to, redagavimo operacijų skaičius ankstesniuose metoduose yra ribotas, todėl sumažėja padidintų duomenų įvairovė ir taip ribojamas veiklos rezultatų padidėjimas. Siekiant įveikti pirmiau minėtus apribojimus, siūlome sistemą, pavadintą Text AutoAugment (TAA), kuria būtų sukurtas sudėtinis ir mokomas duomenų didinimo paradigmas. Mūsų nuomone, įvairių operacijų derinys yra didinimo politika ir naudojame veiksmingą Bayezijos optimizacijos algoritmą, kad automatiškai ieškotume geriausios politikos, kuri iš esmės pagerina modelių generalizacijos gebėjimą. Šešių lyginamųjų duomenų rinkinių eksperimentai rodo, kad TAA padidina klasifikacijos tikslumą mažai išteklių turinčių ir klasių disbalansuotų režimų vidutiniškai atitinkamai 8,8 % ir 9,7 %, o tai viršija tvirtas bazines linijas.Abstract
Зголемувањето на податоците има за цел да ги збогати примероците за обука за олеснување на проблемот со премногу устојувања во ситуации со ниски ресурси или небалансирани класи. Traditional methods first devise task-specific operations such as Synonym Substitute, then preset the corresponding parameters such as the substitution rate artificially, which require a lot of prior knowledge and are prone to fall into the sub-optimum. Покрај тоа, бројот на уредувачките операции е ограничен во претходните методи, што ја намалува различноста на зголемените податоци и со тоа го ограничува профилот. За да ги надминеме наведените ограничувања, предложуваме рамка наречена Text AutoAugment (TAA) за воспоставување композициски и научлив парадигм за зголемување на податоците. Ние ја сметаме комбинацијата на различни операции за политика на зголемување и користиме ефикасен бајезиски алгоритм за оптимизација за автоматски да ја бараме најдобрата политика, која значително ја подобрува генерализацијата на моделите. Експериментите на шест бази на податоци покажуваат дека ТАА ја зголемува точноста на класификацијата во режимите со ниски ресурси и режимите со небалансирани класи за просечно 8,8 отсто и 9,7 отсто, надминувајќи силни бази линии.Abstract
ഡേറ്റാ കൂട്ടിചേര്ക്കുവാന് ഉദ്ദേശിക്കുന്നത് കുറഞ്ഞ വിഭവങ്ങള് അല്ലെങ്കില് ക്ലാസ്സില് അസാധാരണമില്ലാത്ത സ്ഥിതികളി സിനോനിമിന്റ് സ്റ്റിസ്റ്റ്റ്യൂട്ടിറ്റ് പോലുള്ള പാര്ട്ടിക്കേറ്റുകള് ആദ്യം പ്രവര്ത്തിപ്പിക്കുന്ന പ്രത്യേക പ്രവര്ത്തനങ്ങള് നിര്മ്മിക്കുന്നു. പിന് അതിനു പുറമെ, മുമ്പുള്ള രീതികളില് ചിട്ടപ്പെടുത്തുന്ന പ്രവര്ത്തനങ്ങളുടെ എണ്ണം പരിധിയിലാണ്. അത് കൂട്ടിച്ചേര്ത്ത വിവരങ്ങളു മുകളിലുള്ള പരിധികള് പരിജയിക്കാന്, ടെക്സ്റ്റോട്ടോഓഗ്മെന്റ് (TAA) എന്ന പേരുള്ള ഒരു ഫ്രെയിമെന്റ് പ്രൊജക്റ്റ് ചെയ്യുന്ന നമ്മള് വ്യത്യസ്ത പ്രവര്ത്തനങ്ങളുടെ ഒരു കൂട്ടിക്കൂട്ടത്തെ ഒരു കൂട്ടിക്കൂട്ടത്തിന്റെ പോലീസിയായി കരുതുന്നു. അതിന്റെ മാതൃകങ്ങളുടെ ജനറലേഷന് സാധ്യതയ ആറു ബെങ്ക്മാര്ക്ക് ഡാറ്റാസറ്റുകളില് പരീക്ഷണങ്ങള് കാണിക്കുന്നു താഴെ വിഭവങ്ങളിലും ക്ലാസ്സില് അംഗീകരിക്കാത്ത വിഭവങ്ങളിലും TAA ക്ലാസ്സിലും ക്ലAbstract
Дасгал өгөгдлийн нэмэгдүүлэлт нь бага нөөц болон хичээлийн тэгш байдлын тухай асуудлыг багасгах боломжтой багасгах сургалтын жишээг багасгах зорилготой. Эхлээд уламжлалт арга нь анхны ажлын тодорхойлолтой үйл ажиллагааг төсөөл, дараа нь хамааралтай параметрлүүдийг уран бүтээмжтэй байгуулах хурдтай төсөөл. Үүнээс гадна, өмнөх арга замын тоо хэмжээний өөрчлөлт нь хязгаарлагддаг. Энэ нь нэмэгдсэн өгөгдлийн олон янзыг багасгаж, энэ нь үйлдвэрлэлийн ашигыг хязгаарлагддаг. Үүний дээрх хязгаарлалтыг дундуурлахын тулд бид өгөгдлийн нэмэгдүүлэлтийн зохиолын болон суралцсан парадигм болох Text AutoAugment (TAA) гэдэг хэлбэрийг санал дэвшүүлнэ. Бид өөр олон үйл ажиллагаануудыг нэмэгдүүлэх бодлого гэж үздэг. Байзесийн нэмэгдүүлэх алгоритмыг автоматаар хайх хамгийн сайн бодлого гэж ашигладаг. Энэ нь загварын ерөнхийлөгчийн чадварыг сайжруулдаг. Дөрвөлжингийн зургаан багаж өгөгдлийн сангийн туршилтын туршилт нь ТАА нь бага багаж болон хичээлийн тэгш байдлын тодорхойлолтыг дундаж 8.8% болон 9.7%-аар нэмэгдүүлдэг гэдгийг харуулж байна.Abstract
Peningkatan data bertujuan untuk memperkaya sampel latihan untuk mengurangi isu overfitting dalam situasi yang tidak seimbang-rendah sumber atau kelas. Kaedah tradisional terlebih dahulu merancang operasi khusus tugas seperti Pengganti Sinonim, kemudian menentukan parameter yang sepadan seperti kadar penggantian secara buatan, yang memerlukan banyak pengetahuan sebelumnya dan cenderung untuk jatuh ke dalam sub-optimum. Besides, the number of editing operations is limited in the previous methods, which decreases the diversity of the augmented data and thus restricts the performance gain. Untuk mengatasi keterangan di atas, kami cadangan bernama Text AutoAugment (TAA) untuk menetapkan paradigm a komposisi dan boleh belajar untuk peningkatan data. Kami menganggap kombinasi berbagai-bagai operasi sebagai kebijakan peningkatan dan menggunakan algoritma peningkatan Bayesian yang efisien untuk secara automatik mencari kebijakan terbaik, yang meningkatkan kemudahan peningkatan model. Eksperimen pada enam set data benchmark menunjukkan bahawa TAA meningkatkan ketepatan klasifikasi dalam režim sumber rendah dan ketidakseimbang kelas dengan rata-rata 8.8% dan 9.7%, berdasarkan itu, melebihi garis dasar yang kuat.Abstract
Iż-żieda fid-dejta għandha l-għan li tirrikorri kampjuni ta’ taħriġ biex ittaffi l-kwistjoni ta’ tagħmir żejjed f’sitwazzjonijiet b’riżorsi baxxi jew żbilanċjati fil-klassi. Il-metodi tradizzjonali l-ewwel ifasslu operazzjonijiet speċifiċi għall-kompiti bħas-Sustitut tas-Sinonimu, imbagħad jippreskrivu l-parametri korrispondenti bħar-rata tas-sostituzzjoni artifiċjalment, li jeħtieġu ħafna għarfien minn qabel u huma suxxettibbli li jaqgħu fis-subottimu. Barra minn hekk, in-numru ta’ operazzjonijiet ta’ editjar huwa limitat fil-metodi preċedenti, li jnaqqas id-diversità tad-dejta miżjuda u b’hekk jillimita l-qligħ fil-prestazzjoni. To overcome the above limitations, we propose a framework named Text AutoAugment (TAA) to establish a compositional and learnable paradigm for data augmentation. Aħna nqisu kombinazzjoni ta’ diversi operazzjonijiet bħala politika ta’ żieda u nużaw algoritmu effiċjenti ta’ Ottimizzazzjoni Bajesjan biex ifittxu awtomatikament l-a ħjar politika, li ttejjeb sostanzjalment il-kapaċità ta’ ġeneralizzazzjoni tal-mudelli. L-esperimenti fuq sitt settijiet ta’ dejta ta’ parametri referenzjarji juru li t-TAA ssaħħaħ il-preċiżjoni tal-klassifikazzjoni f’reġimi b’riżorsi baxxi u żbilanċjati tal-klassi b’medja ta’ 8.8% u 9.7%, rispettivament, li jaqbżu l-linji bażi b’saħħithom.Abstract
Data augmentation is bedoeld om trainingsmonsters te verrijken om het probleem van overfitting te verlichten in situaties met weinig resources of klasse-onevenwicht. Traditionele methoden bedenken eerst taakspecifieke bewerkingen zoals Synonym Substitute, vervolgens presets de overeenkomstige parameters, zoals de substitutiesnelheid kunstmatig, die veel voorkennis vereisen en neigen om in het suboptimale te vallen. Bovendien is het aantal bewerkingen beperkt in de vorige methoden, wat de diversiteit van de augmented data vermindert en dus de prestatiewinst beperkt. Om bovenstaande beperkingen te overwinnen, stellen we een framework voor genaamd Text AutoAugment (TAA) voor om een compositioneel en leerbaar paradigma voor data augmentatie te creëren. We beschouwen een combinatie van verschillende operaties als een augmentatiebeleid en gebruiken een efficiënt Bayesian Optimization algoritme om automatisch te zoeken naar het beste beleid, wat de generalisatiecapaciteit van modellen aanzienlijk verbetert. Experimenten met zes benchmarkdatasets tonen aan dat TAA de classificatienauwkeurigheid verhoogt in regimes met weinig hulpbronnen en klasse-onevenwicht met een gemiddelde van respectievelijk 8,8% en 9,7%, en de sterke baselines overtreft.Abstract
Data-augmentasjonen måtar å forstørre prøveprøver for å gjere det overpassende problemet i låg ressursar eller klassesimbalanserte situasjonar. Tradisjonale metodane viser første oppgåvespesifikke operasjonar som synonymssubstitusjon, og så forandre dei tilsvarande parametra, slik som substitusjonsrate kunstifisk, som krev mykje førre kunnskap og er nøyaktig å fall i underoptimum. I tillegg er talet på redigeringsoperasjonar begrenset i dei førre metodane, som reduserer mangfolden av dei økte dataene og derfor begrenser utviklinga. For å overføra dei øvste grensene, foreslår vi eit rammeverk med namn Tekst AutoAugment (TAA) for å oppretta ein komposisjonell og lærbar paradigm for data augmentasjon. Vi ser ut ein kombinasjon av ulike operasjonar som eit augmentasjonspolitikk og bruker ein effektivt Bayesian Optimizeringsalgoritme for å søkja etter den beste politikken automatisk, som forbetrar generelliseringsverdien for modeller. Eksperimentar på seks benchmarkdatasett viser at TAA styrer klassifikasjons nøyaktighet i låg ressursar og klassesimbalanserte regimar med gjennomsnittlig 8,8 % og 9,7 %, derfor utfører sterke baselinjer.Abstract
Wzmacnianie danych ma na celu wzbogacenie próbek szkoleniowych w celu złagodzenia problemu nadmiernego dopasowania w sytuacjach niskich zasobów lub nierównowagi klasowej. Tradycyjne metody najpierw opracowują operacje specyficzne dla konkretnych zadań, takie jak Synonym Substitute, a następnie wstępnie sztucznie ustawiają odpowiednie parametry, takie jak współczynnik substytucji, które wymagają dużej wcześniejszej wiedzy i są podatne na wpadanie w suboptymalny. Poza tym liczba operacji edycyjnych jest ograniczona w poprzednich metodach, co zmniejsza różnorodność danych rozszerzonych i tym samym ogranicza przyrost wydajności. Aby przezwyciężyć powyższe ograniczenia, proponujemy framework o nazwie Text AutoAugment (TAA) w celu ustanowienia kompozycyjnego i nauczalnego paradygmatu powiększania danych. Połączenie różnych operacji uważamy za politykę rozszerzenia i wykorzystujemy wydajny algorytm optymalizacji Bayesona do automatycznego wyszukiwania najlepszej polityki, co znacznie poprawia zdolność uogólnienia modeli. Eksperymenty na sześciu zestawach danych referencyjnych pokazują, że TAA zwiększa dokładność klasyfikacji w systemach niskich zasobów i klasowych o średnią 8,8% i 9,7%, przewyższając silne linie bazowe.Abstract
O aumento de dados visa enriquecer amostras de treinamento para aliviar o problema de overfitting em situações de poucos recursos ou de classe desequilibrada. Os métodos tradicionais primeiro concebem operações específicas da tarefa, como Substituto de Sinônimos, e depois pré-ajustam os parâmetros correspondentes, como a taxa de substituição, artificialmente, que exigem muito conhecimento prévio e são propensos a cair no subótimo. Além disso, o número de operações de edição é limitado nos métodos anteriores, o que diminui a diversidade dos dados aumentados e, portanto, restringe o ganho de desempenho. Para superar as limitações acima, propomos um framework chamado Text AutoAugment (TAA) para estabelecer um paradigma de composição e aprendizado para aumento de dados. Consideramos uma combinação de várias operações como uma política de aumento e utilizamos um algoritmo eficiente de Otimização Bayesiana para buscar automaticamente a melhor política, o que melhora substancialmente a capacidade de generalização dos modelos. Experimentos em seis conjuntos de dados de referência mostram que o TAA aumenta a precisão da classificação em regimes de poucos recursos e de classe desequilibrada em uma média de 8,8% e 9,7%, respectivamente, superando as linhas de base fortes.Abstract
Augmentarea datelor vizează îmbogățirea eșantioanelor de instruire pentru atenuarea problemei excesive în situații cu resurse scăzute sau dezechilibrate de clasă. Metodele tradiționale concep mai întâi operațiuni specifice sarcinilor, cum ar fi Synonym Substitute, apoi presetează în mod artificial parametrii corespunzători, cum ar fi rata de substituție, care necesită o mulțime de cunoștințe prealabile și sunt predispuse să cadă în suboptim. În plus, numărul operațiunilor de editare este limitat în metodele anterioare, ceea ce reduce diversitatea datelor augmentate și astfel restrânge câștigul de performanță. Pentru a depăși limitările de mai sus, propunem un cadru numit Text AutoAugment (TAA) pentru a stabili o paradigmă compozițională și învățabilă pentru mărirea datelor. Considerăm o combinație de diferite operațiuni ca o politică de augmentare și utilizăm un algoritm eficient de optimizare bayesiană pentru a căuta automat cea mai bună politică, ceea ce îmbunătățește substanțial capacitatea de generalizare a modelelor. Experimentele efectuate pe șase seturi de date de referință arată că TAA sporește acuratețea clasificării în regimurile cu resurse scăzute și dezechilibrate de clasă cu o medie de 8,8%, respectiv 9,7%, depășind valorile de bază puternice.Abstract
Расширение данных направлено на обогащение обучающих выборок для смягчения проблемы переоснащения в ситуациях с ограниченными ресурсами или с классовой несбалансированностью. Традиционные методы сначала разрабатывают специфические для задачи операции, такие как замена синонима, а затем искусственно задают соответствующие параметры, такие как скорость замены, которые требуют много предварительных знаний и склонны попадать в субоптимум. Кроме того, количество операций редактирования ограничено в предыдущих способах, что уменьшает разнообразие дополненных данных и, таким образом, ограничивает увеличение производительности. Чтобы преодолеть вышеуказанные ограничения, мы предлагаем фреймворк под названием Text AutoAugment (TAA) для создания композиционной и обучаемой парадигмы для увеличения данных. Мы рассматриваем сочетание различных операций как политику дополнения и используем эффективный алгоритм байесовской оптимизации для автоматического поиска наилучшей политики, что существенно улучшает возможности обобщения моделей. Эксперименты с шестью эталонными наборами данных показывают, что TAA повышает точность классификации в режимах с низкими ресурсами и с несбалансированным классом в среднем на 8,8% и 9,7%, соответственно, превосходя сильные базовые линии.Abstract
දත්ත විශාලයක් අදහස් කරනවා ප්රශ්නයක් සැමැල්සුම් විශාලය කරන්න, අඩු සම්පූර්ණ සඳහා ප්රශ්නයක් නැති ස් පාරමාන්ය විද්යාවය පළමු විශේෂ විශේෂ ව්යාපෘති විද්යාපනය කරන්න, හරියට සමාන්ය විද්යාපනය විද්යාපනය, පස්සේ සමාන්ය විද්යාපනය විද්යා ඒ වගේම, සංපාදනය කරන්නේ ක්රියාත්මක ක්රියාත්මක සීමාවිත විදියට, ඒකෙන් විශාලනය කරපු දත්තේ වෙනස් විදියට පහත් උපරිමිත සීමාවක් විශ්වාස කරන්න, අපි තොරතුරු විශාලනය සඳහා සංවිධානයක් ස්ථාපනය කරන්න පුළුවන් පරීක්ෂණය ස්වයංක අපි විවිධ ප්රවේශනය සම්බන්ධ විධානයක් විදිහට පරීක්ෂණය විදිහට පරීක්ෂණය කරනවා ඒ වගේම පරීක්ෂණය කරන්න බේසියාන් විශේෂණය අල්ගෝර බෙන්ච්මාර්ක් දත්ත සැට් හතර පරීක්ෂණය පෙන්වන්නේ TAA එක්ක අඩු සම්පූර්ණය සහ ක්ලාස් අන්තිමත් විදියට අඩු සම්පූර්ණය සඳහා අන්තිමත් විදAbstract
Cilj povečanja podatkov je obogatiti vzorce usposabljanja za lajšanje težav prekomernega opremljanja v razmerah z nizkimi viri ali neravnovesjem razredov. Tradicionalne metode najprej oblikujejo postopke, specifične za opravila, kot je Synonim Substitute, nato umetno prednastavijo ustrezne parametre, kot je stopnja zamenjave, ki zahtevajo veliko predhodnega znanja in so nagnjene k padcu v suboptimalno vrednost. Poleg tega je število operacij urejanja v prejšnjih metodah omejeno, kar zmanjšuje raznolikost povečanih podatkov in s tem omejuje povečanje zmogljivosti. Za premagovanje zgoraj navedenih omejitev predlagamo okvir z imenom Text AutoAugment (TAA) za vzpostavitev kompozicijske in učne paradigme za povečanje podatkov. Kombinacijo različnih operacij obravnavamo kot politiko povečanja in uporabljamo učinkovit Bayezijski algoritem optimizacije za samodejno iskanje najboljše politike, kar bistveno izboljša sposobnost posploševanja modelov. Poskusi na šestih referenčnih naborih podatkov kažejo, da TAA poveča natančnost klasifikacije v režimu z nizkimi viri in razredom neravnoteženih režimih za povprečno 8,8% oziroma 9,7%, kar presega močne osnovne vrednosti.Abstract
Horumarinta macluumaadka waxaa loogu talagalay in lagu hoydo samooyinka waxbarashada si uu u fududeeyo dhibaatada aad u faa'iidayso oo ay u fududaato nolosha hoos-maalmeedka ama xaaladaha aan sinnaan karin. Isku'aalaha caadiga ah marka ugu horeysa waxay sameeyaan shaqooyin gaar ah, tusaale ahaan imtixaanka Synonym, kadibna waxay hormariyaan parameters oo ku haboon sida qiimaha beddelka, taasoo u baahan tahay aqoonta hore iyo in loo caddeeyo inay hoos u dhacaan. Intaas waxaa dheer in tirada waxqabadka hagitaanka waa ku xadan yihiin qaababka hore, taas oo hoos u dhigi kara kala duduwanta macluumaadka la kordhiyey, sidaa darteed waxaa ka dhici kara faa'iidada sameynta. Si aan uga adkaado xaduudaha sare, waxaynu soo jeedaynaa qoraal la odhan jiray Text AutoAugment (TAA) si aan u dhisno kooxaha iyo barbaarinta kordhiska macluumaadka. Waxaynu u aragnaa urur hawlaha kala duduwan oo ah siyaasad kordhiska iyo isticmaalka algorithm faa’iido ah oo Bayesian Optimization si a an automatic u raadinno siyaasada ugu wanaagsan, kaas oo si weyn u kordhiya awoodda dhalashada modellada. Imtixaan ku qoran lix boqolkiiba waxay muuqataa in TAA uu kordhiyaa saxda fasaxda oo uu ku kordhiyo xuquuqda hoose-resource iyo sinnaanta aan la qiimo karin qiyaastii ugu dhexeeya 8.8% iyo 9.7%.Abstract
Rritja e të dhënave synon të pasurojë mostrat e trajnimit për lehtësimin e çështjes së mbipajtimit në situata me burime të ulëta apo të paekuilibruara klasash. Metodat tradicionale krijojnë së pari operacione specifike për detyrat, të tilla si Zëvendësuesi Sinonim, pastaj paracaktojnë parametrat korrespondentë të tilla si norma e zëvendësimit artificialisht, që kërkojnë shumë njohuri të mëparshme dhe janë të propozuar të bien në sub-optimum. Përveç kësaj, numri i operacioneve të ndryshimit është i kufizuar në metodat e mëparshme, që zvogëlon diversitetin e të dhënave të rritura dhe kështu kufizon fitimin e performancës. Për të kapërcyer kufizimet e larta, ne propozojmë një kuadër të quajtur Text AutoAugment (TAA) për të ngritur një paradigm ë kompozitive dhe të mësueshme për rritjen e të dhënave. Ne konsiderojmë një kombinim të operacioneve të ndryshme si një politikë rritjeje dhe përdorim një algoritëm efektiv optimizimi Bayesian për të kërkuar automatikisht për politikën më të mirë, e cila përmirëson thelbësisht aftësinë e gjeneralizimit të modeleve. Eksperimentet në gjashtë baza të dhënash tregojnë se TAA rrit saktësinë e klasifikimit në regjimet me burime të ulëta dhe të paekuilibruar klasash me një mesatare prej 8.8% dhe 9.7%, respektivisht, duke kaluar linjat bazë të forta.Abstract
Povećavanje podataka je cilj obogatiti uzorke obuke za ublažavanje prekomjernog pitanja u situacijama niskih resursa ili niskog različitih klasa. Tradicionalne metode su prvi razmišljale o specifičnim operacijama za zadatak, kao što je sinonim zamjenom, a zatim predstavljaju odgovarajuće parametre poput umjetničke stope zamjene, koje zahtevaju mnogo prethodnih znanja i su spremne da padnu u podoptimum. Osim toga, broj urednih operacija je ograničen u prethodnim metodama, što smanjuje raznolikost povećanih podataka i tako ograničava dobitak provedbe. Da bi preuzeli iznad ograničenja, predlažemo okvir po imenu Text AutoAugment (TAA) da uspostavi kompozicionalnu i učenjenu paradigmu za povećanje podataka. Smatramo kombinaciju različitih operacija kao povećanje politike i iskoristiti efikasan Bayesianski optimizacijski algoritam da automatski traži najbolju politiku, koja značajno poboljšava sposobnost generalizacije modela. Eksperimenti na šest standardnih podataka pokazuju da TAA povećava tačnost klasifikacije u nizim resursima i niskim regimima klase na prosjeku od 8,8% i 9,7%, odnosno, nadmašujući jake osnovne linije.Abstract
Dataförstärkning syftar till att berika utbildningsprover för att lindra problemet med överpassning i situationer med låg resurs eller klassobalans. Traditionella metoder utformar först uppgiftsspecifika operationer som Synonym Substitute, sedan förinställer motsvarande parametrar såsom substitutionsfrekvensen artificiellt, som kräver mycket förhandskunskap och är benägna att falla in i det suboptimala. Dessutom är antalet redigeringsåtgärder begränsat i de tidigare metoderna, vilket minskar mångfalden i de utökade data och därmed begränsar prestandaökningen. För att övervinna ovanstående begränsningar föreslår vi ett ramverk som heter Text AutoAugment (TAA) för att etablera ett kompositionellt och lärbart paradigm för dataökning. Vi ser en kombination av olika operationer som en augmentationspolicy och använder en effektiv Bayesian Optimization algoritm för att automatiskt söka efter den bästa policyn, vilket avsevärt förbättrar generaliseringsförmågan hos modeller. Experiment på sex referensdatauppsättningar visar att TAA ökar klassificeringsnoggrannheten i system med låg resurs och klassobalans med i genomsnitt 8,8% respektive 9,7%, vilket överträffar starka basvärden.Abstract
Kuongezeka kwa taarifa inakusudia kutajirisha sampuli za mafunzo kwa kupunguza suala hili la kusambaa kwa rasilimali chini au hali isiyo na usawa wa darasa. Utawala wa kiutamaduni kwanza hupanga shughuli maalum za kazi kama vile Tamko la Synonym, kisha kutangaza parameters zinazohusiana kama vile kiwango cha mabadiliko kwa kimapenzi, ambacho kinahitaji maarifa mengi ya kabla na wanaonekana kuanguka katika kipindi cha ubora. Zaidi ya hayo, idadi ya operesheni za kuhariri imezuiwa katika njia zilizopita, ambayo inapunguza tofauti za data zilizoongezwa na hivyo kuzuia mafanikio ya utendaji. Ili kushinda vizuizi vya juu, tunapendekeza mfumo unaoitwa Text AutoAugment (TAA) ili kutengeneza mfumo wa jumla na kujifunza kwa kuongeza taarifa. Tunaona muungano wa shughuli mbalimbali kama sera ya kuongeza na kutumia algorithi yenye ufanisi wa Uchaguzi wa Bayesia ili kutafuta sera bora zaidi, ambayo inaongeza uwezo wa uzalishaji wa mifano. Experiments on six benchmark datasets show that TAA boosts classification accuracy in low-resource and class-imbalanced regimes by an average of 8.8% and 9.7%, respectively, outperforming strong baselines.Abstract
தரவு கூட்டுதல் பயிற்சி மாதிரிகளை செலுத்த வேண்டும் குறைந்த மூலத்தில் அல்லது வகுப்பு சமமில்லாத நிலைகளில் மாற்றும் பிரச் பாரம்பரிய முறைகள் முதலில் செயல் குறிப்பிட்ட செயல்பாடுகளை ஒத்திசைப்படுத்தும் போன்ற செயல்பாடுகளை உருவாக்குகிறது, பின்னர் ஒத்திருக்கும் அளபுருக்களை கூட்டு மேலும், முந்தைய முறைமைகளில் திருத்தும் செயல்பாடுகளின் எண்ணிக்கை வரையறுக்கப்பட்டுள்ளது, அது கூட்டப்பட்ட தரவின் பல்வேறு வித் மேலே உள்ள எல்லைகளை வெற்றி பெற, நாம் உரை தானியங்கி உருவாக்குதல் (TAA) என்ற சட்டத்தை திருந்துகிறோம் தரவு கூட்டுதலுக்கான ஒரு சூழல நாம் பல்வேறு செயல்பாடுகளை ஒரு கூட்டுதல் கொள்கையாக எண்ணுகிறோம் மற்றும் ஒரு வேறு பேயிசியன் விருப்பங்கள் முறைமையை தேடுவதற்கு தானாகவே தேடும் சிறந்த க ஆறு பெங்குறிப்பு தரவுத்தளங்களில் சோதனைகள் காட்டுகிறது TAA குறைந்த வளங்கள் மற்றும் வகுப்பு நிலையில் வகுப்பு சரியான திட்டத்தை அதிகரிக்கும் சராசரியாக 8.Abstract
Maglumat ýetişirmeginiň maksady düşük resurslar ýa-da klas täsirlenmedik durumlarda ýetişiklik etmek üçin baýramçylyk örneklerini baýramlaşdyrmak üçin baýramçylyga golaýlaýar. Däpli täzelikler ilkinji gezek gören-a ýratynyň üstine synonym taýýarlamasy ýaly eser goşulýar, soňra ýene-täzelikli parameterleri ýaly eser taýýarlamasy ýaly, birnäçe öňki bilgiň köpüsini talep edýän we süper-optimize düşenler. Munuň ýagdaýda, düzenleme işleriň sany öňki yönlerde çykarylýar. Bu ýene-de gelişmiş maglumatlaryň näçeşitligini azaltýar we şonuň üçin etkinlik gazanlygyny azaltýar. Yukarıdaki sınırlardan üstlenmek üçin, veri büyütmek üçin bir kompozisyonal ve öğrenebilen bir paradigm kurulmak için Tekst OtoAugment (TAA) adlı bir çerçeve teklif ediyoruz. Biz dürli işlemleriň birleşigini ýagdaýlaşdyrma politika hökmünde we etkinlik Bayesian Optimizasyň algoritmini gowy syýasaty gözlemek üçin ullanýarys, bu nusgalaryň döredilik ukyplaryny gowurarlar. Alty benchmark sanatyndaky denminatlar TAA klasifikasiýasynyň düşük resurslar we klas taýýarlanmagy derejesini 8.8% we 9.7% derejesinde döwürýär.Abstract
ڈاٹا افزایش کا ارادہ ہے کہ کم رسورس یا کلاس نابرالنس کی موقعیت میں زیادہ فائدہ اٹھانے والی مسئلہ کو کمزور کرنے کے لئے ترینسی نمونے ثروت کرنے کے لئے۔ پیغمبر طریقے پہلے دنیا کے مطابق مخصوص عملیات کی پیدائش کریں جیسے سینونیم پیدائش کریں، پھر پیدائش پارامیٹوں کی پیدائش کریں جیسے پیدائش رٹ، جو پہلے بہت سے علم کی ضرورت رکھتے ہیں اور ان کے لئے زیادہ اچھی مطابق ہو جاتے ہیں. اور اگلے طریقے میں سمجھنے کی عملیات کی تعداد محدود ہوتی ہے، جو بڑھی ہوئی ڈیٹا کی مختلفیت کو کم کر دیتی ہے اور اسی طرح عملیات کو کم کر دیتی ہے. اوپر سے محدودیت پر غالب ہونے کے لئے، ہم ایک فرمود کی پیشنهاد کرتے ہیں جس کا نام Text AutoAugment (TAA) ہے تاکہ ڈاٹ افزایش کے لئے ایک ترکیب اور سکھانے والی پارادیگ بنائے۔ ہم مختلف عملیات کی ترکیب کو اضافہ پالیسی کے طور پر سمجھتے ہیں اور ایک عمدہ بائیزین اپٹیمایزٹ الگوریٹم کو استعمال کرتے ہیں کہ اچھی پالیسی کو اپنا سیدھا تلاش کریں، جو ماڈل کے عمومی قابلیت کو اضافہ کرتا ہے۔ چھ بنچم مارک ڈیٹ سٹ کے تجربے دکھاتے ہیں کہ ٹا ا ا ا ا ا ا ا آس کے ساتھ کم منبع اور کلاس نابرالنس رژیموں میں تقریباً مزید 8.8% اور 9.7% کے متوسط سے زیادہ طاقتور بنسٹ لینوں سے بڑھتا ہے۔Abstract
@ info Name Tahrirlash amallar soni oldingi usullarda chegara, bu qoʻshilgan maʼlumot tarkibini kamaytirish va shunday qilib bajarish imkoniyatini kamaytirish. Yuqori chegaralarni oshirish uchun, Matn Avto- Augment (TAA) nomli freymni taʼminlovchi maʼlumot qoʻshish uchun kompyuterni va o'rganadigan paradigmni yaratishni davom qilamiz. Biz har xil amallar birlashtirishni tasdiqlash qoidasi deb hisoblanamiz va avtomatik foydalanish uchun yaxshi ko'proq qoidadan foydalanamiz. Bu modellarning generaliz imkoniyatini oshirish mumkin. NameAbstract
Sự gia tăng dữ liệu nhằm hướng tới việc cải thiện các mẫu giáo nhằm giảm bớt vấn đề giới hạn trong tình trạng thiếu tài nguyên hay thiếu cân bằng. Các phương pháp truyền thống đầu tiên phát triển các thao tác đặc nhiệm như Synonym con cơ sở, rồi thiết lập các tham số tương ứng như tiến trình thay đổi thường xuyên, cần rất nhiều kiến thức trước và có xu hướng rơi xuống mức tối ưu tiên. Hơn nữa, số thao tác soạn thảo đã được giới hạn trong các phương pháp trước, làm giảm sự đa dạng của các dữ liệu tăng trưởng và hạn chế khả năng đạt được. Để vượt qua những giới hạn trên, chúng tôi đề xuất một hệ thống có tên là Stencil AutoAugment (TAA) để thiết lập một mô hình ảnh về độ phân phối và dạy dỗ dữ liệu. Chúng tôi cho rằng sự kết hợp các hoạt động khác nhau là một chính sách gia tăng và sử dụng một thuật to án ứng độ có hiệu quả tại Bayisian Opmiation để tự động tìm kiếm chính sách tốt nhất, điều đó có thể cải thiện khả năng mô- đun tổng hợp. Thí nghiệm trên sáu nhà dữ liệu tiêu chuẩn cho thấy rằng TAA thúc đẩy độ chính xác phân loại trong chế độ thấp tài nguyên và phù hợp với mức độ trung bình 8.8+ và 9.7 NameAbstract
据强旨丰练样本,以纾资源不足或类不平之过拟合。 古法先设特定于事,如同义词代,然后人为地设参数,如代率,此多先验知而易次优也。 又前代之法,编操之数限,降增数之多样性,以限性能之高。 为文本自强(TAA)之框架,以立复合、可学也。 以众操为强策,以高效贝叶斯优化算法自索为上策,以大大提高泛化能。 六准实验集,TAA在下类不平之类准确性均升8.8%9.7%,优于强基线。- Anthology ID:
- 2021.emnlp-main.711
- Volume:
- Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing
- Month:
- November
- Year:
- 2021
- Address:
- Online and Punta Cana, Dominican Republic
- Venue:
- EMNLP
- SIG:
- Publisher:
- Association for Computational Linguistics
- Note:
- Pages:
- 9029–9043
- Language:
- URL:
- https://aclanthology.org/2021.emnlp-main.711
- DOI:
- 10.18653/v1/2021.emnlp-main.711
- Bibkey:
- Cite (ACL):
- Shuhuai Ren, Jinchao Zhang, Lei Li, Xu Sun, and Jie Zhou. 2021. Text AutoAugment : Learning Compositional Augmentation Policy for Text ClassificationAutoAugment: Learning Compositional Augmentation Policy for Text Classification. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 9029–9043, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.
- Cite (Informal):
- Text AutoAugment : Learning Compositional Augmentation Policy for Text ClassificationAutoAugment: Learning Compositional Augmentation Policy for Text Classification (Ren et al., EMNLP 2021)
- Copy Citation:
- PDF:
- https://aclanthology.org/2021.emnlp-main.711.pdf
- Code
- lancopku/text-autoaugment
- Data
- IMDb Movie Reviews, SST
- Terminologies:
Export citation
@inproceedings{ren-etal-2021-text, title = "Text AutoAugment : Learning Compositional Augmentation Policy for Text Classification{A}uto{A}ugment: Learning Compositional Augmentation Policy for Text Classification", author = "Ren, Shuhuai and Zhang, Jinchao and Li, Lei and Sun, Xu and Zhou, Jie", booktitle = "Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing", month = nov, year = "2021", address = "Online and Punta Cana, Dominican Republic", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2021.emnlp-main.711", doi = "10.18653/v1/2021.emnlp-main.711", pages = "9029--9043", }
<?xml version="1.0" encoding="UTF-8"?> <modsCollection xmlns="http://www.loc.gov/mods/v3"> <mods ID="ren-etal-2021-text"> <titleInfo> <title>Text AutoAugment : Learning Compositional Augmentation Policy for Text ClassificationAutoAugment: Learning Compositional Augmentation Policy for Text Classification</title> </titleInfo> <name type="personal"> <namePart type="given">Shuhuai</namePart> <namePart type="family">Ren</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Jinchao</namePart> <namePart type="family">Zhang</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Lei</namePart> <namePart type="family">Li</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Xu</namePart> <namePart type="family">Sun</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <name type="personal"> <namePart type="given">Jie</namePart> <namePart type="family">Zhou</namePart> <role> <roleTerm authority="marcrelator" type="text">author</roleTerm> </role> </name> <originInfo> <dateIssued>2021-11</dateIssued> </originInfo> <typeOfResource>text</typeOfResource> <relatedItem type="host"> <titleInfo> <title>Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing</title> </titleInfo> <originInfo> <publisher>Association for Computational Linguistics</publisher> <place> <placeTerm type="text">Online and Punta Cana, Dominican Republic</placeTerm> </place> </originInfo> <genre authority="marcgt">conference publication</genre> </relatedItem> <identifier type="citekey">ren-etal-2021-text</identifier> <identifier type="doi">10.18653/v1/2021.emnlp-main.711</identifier> <location> <url>https://aclanthology.org/2021.emnlp-main.711</url> </location> <part> <date>2021-11</date> <extent unit="page"> <start>9029</start> <end>9043</end> </extent> </part> </mods> </modsCollection>
%0 Conference Proceedings %T Text AutoAugment : Learning Compositional Augmentation Policy for Text ClassificationAutoAugment: Learning Compositional Augmentation Policy for Text Classification %A Ren, Shuhuai %A Zhang, Jinchao %A Li, Lei %A Sun, Xu %A Zhou, Jie %S Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing %D 2021 %8 November %I Association for Computational Linguistics %C Online and Punta Cana, Dominican Republic %F ren-etal-2021-text %R 10.18653/v1/2021.emnlp-main.711 %U https://aclanthology.org/2021.emnlp-main.711 %U https://doi.org/10.18653/v1/2021.emnlp-main.711 %P 9029-9043
Markdown (Informal)
[Text AutoAugment : Learning Compositional Augmentation Policy for Text ClassificationAutoAugment: Learning Compositional Augmentation Policy for Text Classification](https://aclanthology.org/2021.emnlp-main.711) (Ren et al., EMNLP 2021)
- Text AutoAugment : Learning Compositional Augmentation Policy for Text ClassificationAutoAugment: Learning Compositional Augmentation Policy for Text Classification (Ren et al., EMNLP 2021)
ACL
- Shuhuai Ren, Jinchao Zhang, Lei Li, Xu Sun, and Jie Zhou. 2021. Text AutoAugment : Learning Compositional Augmentation Policy for Text ClassificationAutoAugment: Learning Compositional Augmentation Policy for Text Classification. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 9029–9043, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.