Klasifikasi berita hoaks bahasa Indonesia menggunakan indobert fine-tuning dengan pendekatan focal loss pada data tidak seimbang

Dimensions

Kunaefi, Aang, Abidin, Zainal ORCID: https://orcid.org/0000-0002-9261-4952 and Kusumawati, Ririen ORCID: https://orcid.org/0000-0001-6090-7219 (2025) Klasifikasi berita hoaks bahasa Indonesia menggunakan indobert fine-tuning dengan pendekatan focal loss pada data tidak seimbang. JIPI: Jurnal Ilmiah Penelitian dan Pembelajaran Informatika, 10 (2). pp. 1706-1714. ISSN 2540-8984

Preview

Text
24080.pdf - Published Version
Available under License Creative Commons Attribution Share Alike.
Download (563kB) | Preview

Full text available at: https://jurnal.stkippgritulungagung.ac.id/index.ph...

Abstract

Penyebaran berita hoaks di media online menjadi isu serius di tengah meningkatnya konsumsi informasi digital di kalangan masyarakat. Klasifikasi berita hoaks berbahasa Indonesia memiliki peran penting untuk menekan penyebaran informasi palsu. Salah satu tantangan utama dalam sistem klasifikasi ini adalah ketidakseimbangan distribusi data, di mana jumlah berita non-hoaks jauh lebih banyak dibanding-kan berita hoaks. Penelitian ini mengusulkan pendekatan klasifikasi berita hoaks berbahasa Indonesia melalui teknologi Natural Lan-guange Processing (NLP) menggunakan fine-tuning model IndoBERT, yang merupakan pre-trained language model berbasis arsitektur BERT (Bidirectional Encoder Representations from Transformers) dan dis-esuaikan untuk Bahasa Indonesia. Ketidakseimbangan data diatasi menggunakan metode Focal Loss. Pendekatan focal loss dirancang untuk lebih menekankan pembelajaran pada sampel kelas minoritas yang sulit diklasifikasikan. Penelitian ini menggunakan dataset dari platform Kaggle, Huggingfase dan Mendeley. Tataset mencakup berita Bahasa Indonesia dengan jumlah data berita hoaks jauh lebih kecil dari berita faktual. Hasil evaluasi menunjukkan bahwa kombinasi In-doBERT dan Focal Loss mampu meningkatkan performa model dengan akurasi sebesar 98.3% dibandingkan dengan pendekatan Cross-Entropy Loss yang mendapat akurasi 97% Penelitian ini menun-jukkan bahwa penggabungan model berbasis bahasa alami dengan strategi penanganan data tidak seimbang dapat memberikan hasil yang lebih akurat dalam mendeteksi berita hoaks.

Item Type:	Journal Article
Keywords:	Berita Hoaks; Fine Tuning; Focal Loss; IndoBERT; Pemrosesan Bahasa Alami (NLP)
Subjects:	08 INFORMATION AND COMPUTING SCIENCES > 0806 Information Systems 08 INFORMATION AND COMPUTING SCIENCES > 0899 Other Information and Computing Sciences
Divisions:	Graduate Schools > Magister Programme > Graduate School of Informatics Engineering
Depositing User:	Ririen Kusumawati
Date Deposited:	14 Jul 2025 09:32

Downloads

Downloads per month over past year

Origin of downloads

Actions (login required)

View Item

CORE (COnnecting REpositories)