TY - JOUR JF - Conferences; Vol. 1 No. 4 (2025): ?GEOAXBOROT TEXNOLOGIYALARINI TAKOMILLASHTIRISH MASALALARI: INNOVATSIYALAR, BARQAROR RIVOJLANISH VA GLOBAL HAMKORLIK Xalqaro ilmiy-amaliy konferensiya; 104-106 ID - arxiv4261 KW - toksik xabarlar; mini-korpus; BERTbek; klassifikatsiya modeli; o?zbek tili; Telegram; mashinaviy o?rganish; chuqur o?rganish Y1 - 2025/10/20/ TI - O?ZBEK TILIDAGI TOKSIK XABARLAR UCHUN MAXSUS MINIKORPUS YARATISH VA UNING ASOSIDA KLASSIFIKATSIYA MODELI QURISH UR - https://xiuresearch.com/index.php/Conferences/article/view/282 PB - Conferences N2 - Ushbu tadqiqot o?zbek tilida yozilgan ijtimoiy tarmoq xabarlaridagi toksiklikni aniqlash uchun maxsus mini-korpus yaratish va uning asosida avtomatik klassifikatsiya modelini qurishga bag?ishlangan. O?zbek tili agglutinativ xususiyatga ega bo?lgani sababli, bitta so?zning turli morfologik shakllari ma?no jihatidan sezilarli farq qilishi mumkin. Shu bois, toksiklikni aniqlovchi modellar uchun tilga mos ma?lumotlar bazasini shakllantirish muhim ahamiyat kasb etadi. Tadqiqot davomida 6000 dan ortiq Telegram xabarlaridan iborat matnlar to?plami yig?ilib, tozalandi va qo?lda ?toksik? hamda ?normal? toifalarga ajratildi. Mini-korpus asosida turli klassifikatsiya modellari sinovdan o?tkazildi, jumladan TF-IDF + SVM, CNN, BiLSTM va BERTbek. Natijalarga ko?ra, BERTbek modeli eng yuqori aniqlikka (F1-score = 0.91) erishdi. Ish natijalari shuni ko?rsatadiki, kichik hajmdagi balansli korpus yordamida ham o?zbek tili uchuntoksiklikni aniqlovchi yuqori sifatli modelni yaratish mumkin. Ushbu yondashuv o?zbek tilida ijtimoiy xavfli kontentni aniqlash va filtrlash tizimlarini shakllantirish uchun muhim bosqich hisoblanadi.  A1 - Ozod Jurayevich, Babomurodov A1 - Feruzaxon Alisher qizi, Qo?yliyeva AV - none ER -