Kunaefi, Aang, Abidin, Zainal
ORCID: https://orcid.org/0000-0002-9261-4952 and Kusumawati, Ririen
ORCID: https://orcid.org/0000-0001-6090-7219
(2025)
Klasifikasi berita hoaks bahasa Indonesia menggunakan indobert fine-tuning dengan pendekatan focal loss pada data tidak seimbang.
JIPI: Jurnal Ilmiah Penelitian dan Pembelajaran Informatika, 10 (2).
pp. 1706-1714.
ISSN 2540-8984
|
Text
24080.pdf - Published Version Available under License Creative Commons Attribution Share Alike. Download (563kB) | Preview |
Abstract
Penyebaran berita hoaks di media online menjadi isu serius di tengah meningkatnya konsumsi informasi digital di kalangan masyarakat. Klasifikasi berita hoaks berbahasa Indonesia memiliki peran penting untuk menekan penyebaran informasi palsu. Salah satu tantangan utama dalam sistem klasifikasi ini adalah ketidakseimbangan distribusi data, di mana jumlah berita non-hoaks jauh lebih banyak dibanding-kan berita hoaks. Penelitian ini mengusulkan pendekatan klasifikasi berita hoaks berbahasa Indonesia melalui teknologi Natural Lan-guange Processing (NLP) menggunakan fine-tuning model IndoBERT, yang merupakan pre-trained language model berbasis arsitektur BERT (Bidirectional Encoder Representations from Transformers) dan dis-esuaikan untuk Bahasa Indonesia. Ketidakseimbangan data diatasi menggunakan metode Focal Loss. Pendekatan focal loss dirancang untuk lebih menekankan pembelajaran pada sampel kelas minoritas yang sulit diklasifikasikan. Penelitian ini menggunakan dataset dari platform Kaggle, Huggingfase dan Mendeley. Tataset mencakup berita Bahasa Indonesia dengan jumlah data berita hoaks jauh lebih kecil dari berita faktual. Hasil evaluasi menunjukkan bahwa kombinasi In-doBERT dan Focal Loss mampu meningkatkan performa model dengan akurasi sebesar 98.3% dibandingkan dengan pendekatan Cross-Entropy Loss yang mendapat akurasi 97% Penelitian ini menun-jukkan bahwa penggabungan model berbasis bahasa alami dengan strategi penanganan data tidak seimbang dapat memberikan hasil yang lebih akurat dalam mendeteksi berita hoaks.
| Item Type: | Journal Article |
|---|---|
| Keywords: | Berita Hoaks; Fine Tuning; Focal Loss; IndoBERT; Pemrosesan Bahasa Alami (NLP) |
| Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0806 Information Systems 08 INFORMATION AND COMPUTING SCIENCES > 0899 Other Information and Computing Sciences |
| Divisions: | Graduate Schools > Magister Programme > Graduate School of Informatics Engineering |
| Depositing User: | Ririen Kusumawati |
| Date Deposited: | 14 Jul 2025 09:32 |
Downloads
Downloads per month over past year
Origin of downloads
Actions (login required)
![]() |
View Item |
Dimensions
Dimensions