relation: https://arxiv.academicsbook.com/id/eprint/4261/ title: O‘ZBEK TILIDAGI TOKSIK XABARLAR UCHUN MAXSUS MINIKORPUS YARATISH VA UNING ASOSIDA KLASSIFIKATSIYA MODELI QURISH creator: Ozod Jurayevich, Babomurodov creator: Feruzaxon Alisher qizi, Qo‘yliyeva description: Ushbu tadqiqot o‘zbek tilida yozilgan ijtimoiy tarmoq xabarlaridagi toksiklikni aniqlash uchun maxsus mini-korpus yaratish va uning asosida avtomatik klassifikatsiya modelini qurishga bag‘ishlangan. O‘zbek tili agglutinativ xususiyatga ega bo‘lgani sababli, bitta so‘zning turli morfologik shakllari ma’no jihatidan sezilarli farq qilishi mumkin. Shu bois, toksiklikni aniqlovchi modellar uchun tilga mos ma’lumotlar bazasini shakllantirish muhim ahamiyat kasb etadi. Tadqiqot davomida 6000 dan ortiq Telegram xabarlaridan iborat matnlar to‘plami yig‘ilib, tozalandi va qo‘lda “toksik” hamda “normal” toifalarga ajratildi. Mini-korpus asosida turli klassifikatsiya modellari sinovdan o‘tkazildi, jumladan TF-IDF + SVM, CNN, BiLSTM va BERTbek. Natijalarga ko‘ra, BERTbek modeli eng yuqori aniqlikka (F1-score = 0.91) erishdi. Ish natijalari shuni ko‘rsatadiki, kichik hajmdagi balansli korpus yordamida ham o‘zbek tili uchuntoksiklikni aniqlovchi yuqori sifatli modelni yaratish mumkin. Ushbu yondashuv o‘zbek tilida ijtimoiy xavfli kontentni aniqlash va filtrlash tizimlarini shakllantirish uchun muhim bosqich hisoblanadi.  publisher: Conferences date: 2025-10-20 type: Article type: NonPeerReviewed identifier: Ozod Jurayevich, Babomurodov and Feruzaxon Alisher qizi, Qo‘yliyeva (2025) O‘ZBEK TILIDAGI TOKSIK XABARLAR UCHUN MAXSUS MINIKORPUS YARATISH VA UNING ASOSIDA KLASSIFIKATSIYA MODELI QURISH. Conferences; Vol. 1 No. 4 (2025): “GEOAXBOROT TEXNOLOGIYALARINI TAKOMILLASHTIRISH MASALALARI: INNOVATSIYALAR, BARQAROR RIVOJLANISH VA GLOBAL HAMKORLIK Xalqaro ilmiy-amaliy konferensiya; 104-106. relation: https://xiuresearch.com/index.php/Conferences/article/view/282