Download PDFOpen PDF in browser
EN
The title and the abstract of this preprint are also available in English

Morfologik Teg Va N-Grammlar Vositasida Soxta Yangiliklarni Tasniflash

EasyChair Preprint no. 11050

11 pagesDate: October 9, 2023

Abstract

Bugungi kunda ijtimoiy tarmoqlardagi soxta yangiliklarni samarali aniqlash usullarini o‘rganish juda muhim va dolzarb vazifa hisoblanadi. Ushbu usullar ko‘plab tadqiqot sohalarida, jumladan morfologik tahlilda o‘rganiladi. Ba’zi NLP tadqiqotchilarning ta’kidlashicha, oddiy kontent bilan bog‘liq n-gramlar va POS teglash orqali soxta yangiliklarni tasniflash uchun etarli emas. Biroq, ular so‘nggi o‘n yillikda bu bayonotlarni eksperimental ravishda tasdiqlashi mumkin bo‘lgan hech qanday empirik tadqiqot natijalarini olmaganlar. Ushbu qarama-qarshilikni hisobga olgan holda, maqolaning asosiy maqsadi soxta va haqiqiy yangiliklarni to‘g‘ri tasniflash uchun n-gramlar va POS teglashdan umumiy foydalanish imkoniyatlarini eksperimental baholashdan iborat. Korpus matnlarini POS teglarning n-grammlari aniqlandi va keyinchalik tahlil qilindi. Soxta yangiliklarni aniqlashning dastlabki ishlov berish bosqichida n-grammlarning turli guruhlariga POS teglash asoslangan uchta usul taklif qilindi va qo‘llanildi. Shu maqsadda n-gramm o‘lchami birinchi bo‘lib tekshirildi. Aniqlangan n-grammlar asosida yetarli darajada umumlashtirish uchun qaror daraxtlarining eng mos chuqurligi aniqlandi. Nihoyat, tavsiya etilgan usullarga asoslangan modellarning ishlash ko‘rsatkichlari standartlashtirilgan TF-IDF qiymatlari bilan taqqoslandi. Aniqlik (precision), recall va f1-score kabi modelning samaradorlik ko‘rsatkichlari bir necha marta tekshiridi. Shunigdek, TF-IDF usulini POS teglash yordamida yaxshilash mumkinmi degan savol batafsil o‘rganildi. Tadqiqot natijalari shuni ko‘rsatdiki, yangi taklif qilingan metod an’anaviy TF-IDF texnikasi bilan solishtirilganda aniqroq ko‘rsatkichlarni qayd etdi. Xulosa sifatida morfologik tahlilning asosiy TF-IDF metodini yaxshilashi mumkinligini aytish mumkin.

Keyphrases: morphological analysis, NLP, POS tegging

BibTeX entry
BibTeX does not have the right entry for preprints. This is a hack for producing the correct reference:
@Booklet{EasyChair:11050,
  author = {Botir Elov and Nizomaddin Khudayberganov and Zilola Khusainova},
  title = {Morfologik Teg Va N-Grammlar Vositasida Soxta Yangiliklarni Tasniflash},
  howpublished = {EasyChair Preprint no. 11050},

  year = {EasyChair, 2023}}
Download PDFOpen PDF in browser