Holle, Khadijah Fahmi Hayati ORCID: https://orcid.org/0000-0002-6991-1748, Alfianita, Rizha and Putri, Hikmatul Maulidia (2024) Evaluasi teknik preprocessing terhadap kinerja multinomial Naïve Bayes dalam klasifikasi pertanyaan insincere. JUSTIN (Jurnal Sistem dan Teknologi Informasi), 12 (4). pp. 707-715. ISSN 2460-3562 (p); 2620-8989 (e)
Text
21208.pdf Download (619kB) |
Abstract
Platform komunitas tanya-jawab atau Community Question Answering (CQA) telah menjadi sumber informasi yang penting namun menghadapi tantangan, salah satunya adalah adanya pertanyaan insincere. Pertanyaan insincere ini mengacu pada pertanyaan yang tidak tulus dan sering didasarkan pada asumsi keliru, yang dapat mengganggu kenyamanan pengguna dan menyebabkan penyebaran informasi yang menyesatkan. Oleh karena itu, diperlukan deteksi pertanyaan insincere. Penelitian ini bertujuan untuk mengevaluasi pengaruh teknik preprocessing teks terhadap kinerja algoritma Multinomial Naïve Bayes (MNB) dalam mengklasifikasikan pertanyaan insincere. Data yang digunakan terdiri dari 4000 pertanyaan dari Quora, dengan masing-masing 2000 pertanyaan berlabel insincere dan 2000 berlabel sincere. Pembobotan kata dilakukan menggunakan TF-IDF. Terdapat 4 skenario pengujian yang berfokus pada variasi tahap preprocessing untuk mengetahui pengaruh preprocessing terhadap akurasi sistem. Skenario tersebut adalah MNB dengan stemming, MNB dengan lemmatization, MNB tanpa stemming, dan MNB dengan stemming tanpa stopword removal. Pengujian dilakukan menggunakan teknik k-Fold Cross Validation. Hasil uji coba menunjukkan bahwa skenario MNB dengan stemming tanpa stopword removal memberikan hasil terbaik dengan akurasi 83%, presisi 78%, recall 94%, dan F1-score 85%. Sehingga dapat disimpulkan bahwa pemilihan teknik pemrosesan teks yang tepat sangat penting untuk meningkatkan kinerja teks, khususnya dalam mendeteksi pertanyaan insincere pada platform CQA.
Item Type: | Journal Article |
---|---|
Keywords: | Klasifikasi pertanyaan; Pertanyaan Insincere; Quora; Multinomial Naïve Bayes; Preprocessing Text |
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080107 Natural Language Processing 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing |
Divisions: | Faculty of Technology > Department of Informatics Engineering |
Depositing User: | Khadijah Fahmi Hayati Holle |
Date Deposited: | 04 Nov 2024 15:19 |
Downloads
Downloads per month over past year
Origin of downloads
Actions (login required)
View Item |