%K toksik xabarlar; mini-korpus; BERTbek; klassifikatsiya modeli; o‘zbek tili; Telegram; mashinaviy o‘rganish; chuqur o‘rganish %J Conferences; Vol. 1 No. 4 (2025): “GEOAXBOROT TEXNOLOGIYALARINI TAKOMILLASHTIRISH MASALALARI: INNOVATSIYALAR, BARQAROR RIVOJLANISH VA GLOBAL HAMKORLIK Xalqaro ilmiy-amaliy konferensiya; 104-106 %T O‘ZBEK TILIDAGI TOKSIK XABARLAR UCHUN MAXSUS MINIKORPUS YARATISH VA UNING ASOSIDA KLASSIFIKATSIYA MODELI QURISH %I Conferences %A Babomurodov Ozod Jurayevich %A Qo‘yliyeva Feruzaxon Alisher qizi %X Ushbu tadqiqot o‘zbek tilida yozilgan ijtimoiy tarmoq xabarlaridagi toksiklikni aniqlash uchun maxsus mini-korpus yaratish va uning asosida avtomatik klassifikatsiya modelini qurishga bag‘ishlangan. O‘zbek tili agglutinativ xususiyatga ega bo‘lgani sababli, bitta so‘zning turli morfologik shakllari ma’no jihatidan sezilarli farq qilishi mumkin. Shu bois, toksiklikni aniqlovchi modellar uchun tilga mos ma’lumotlar bazasini shakllantirish muhim ahamiyat kasb etadi. Tadqiqot davomida 6000 dan ortiq Telegram xabarlaridan iborat matnlar to‘plami yig‘ilib, tozalandi va qo‘lda “toksik” hamda “normal” toifalarga ajratildi. Mini-korpus asosida turli klassifikatsiya modellari sinovdan o‘tkazildi, jumladan TF-IDF + SVM, CNN, BiLSTM va BERTbek. Natijalarga ko‘ra, BERTbek modeli eng yuqori aniqlikka (F1-score = 0.91) erishdi. Ish natijalari shuni ko‘rsatadiki, kichik hajmdagi balansli korpus yordamida ham o‘zbek tili uchuntoksiklikni aniqlovchi yuqori sifatli modelni yaratish mumkin. Ushbu yondashuv o‘zbek tilida ijtimoiy xavfli kontentni aniqlash va filtrlash tizimlarini shakllantirish uchun muhim bosqich hisoblanadi.  %L arxiv4261 %D 2025