Fakultas Teknologi Informasi

Analisis Sentimen Publik Terhadap Kampanye Pengurangan Sampah Plastik Menggunakan Algoritma Naïve Bayes

Penulis
Dosen:
  1. SARI SUSANTI
Tanggal Terbit
19 Agustus 2025
Kategori
Jurnal Nasional Terakreditasi [SINTA 4]
Penerbit
Universitas Muhammadiyah Riau
Kota / Negara
Riau / Indonesia
Volume
15/2
Halaman
202/212
ISSN
2089-3353
E-ISSN
2808-9162
URL
https://ejurnal.umri.ac.id/index.php/JIK/article/view/9574
Abstrak
Sampah plastik menjadi salah satu sumber pencemaran lingkungan yang mengkhawatirkan di Indonesia. Berbagai
kampanye pengurangan plastik digencarkan, terutama melalui media sosial X (sebelumnya Twitter). Penelitian ini
bertujuan untuk menganalisis sentimen masyarakat terhadap kampanye tersebut menggunakan algoritma Naïve
Bayes. Data yang digunakan berupa 4.351 tweet berbahasa Indonesia yang dikumpulkan selama November 2024–
April 2025 dengan kata kunci “sampah plastik”, “kurangi plastik”, dan “polusi plastik”. Proses analisis mengikuti
tahapan CRISP-DM. Data diproses melalui tahapan preprocessing Data diproses melalui tahapan preprocessing
seperti cleaning, tokenisasi, dan stemming, kemudian dilabeli secara otomatis menggunakan IndoBERT, sebuah
model pra-terlatih berbasis BERT yang dirancang khusus untuk klasifikasi sentimen dalam bahasa Indonesia. Fitur
diekstraksi dengan TF-IDF, dan model dilatih menggunakan tiga skenario pembagian data (60:40, 70:30, dan
80:20). Untuk mengatasi ketidakseimbangan kelas yang ditemukan, diterapkan teknik Random Over Sampling
(ROS). ROS bekerja dengan menduplikasi data dari kelas minoritas untuk menyeimbangkan distribusi data latih,
yang bertujuan agar model dapat belajar secara lebih adil. Hasil evaluasi menunjukkan bahwa tanpa ROS, model
tidak mampu mengenali kelas sentimen positif (recall = 0). Namun setelah ROS diterapkan, performa model
meningkat signifikan, terutama pada kelas minoritas, dengan kenaikan recall hingga lebih dari 59%. Peningkatan
ini membuktikan bahwa ROS efektif dalam memperbaiki performa model untuk analisis sentimen pada data yang
tidak seimbang. Penelitian ini diharapkan dapat memberikan kontribusi dalam pemanfaatan machine learning
untuk memahami persepsi publik dan mendukung perumusan kebijakan lingkungan yang lebih efektif.