Analisis Sentimen Publik Terhadap Kampanye Pengurangan Sampah Plastik Menggunakan Algoritma Naïve Bayes
Penulis |
---|
Dosen: |
Tanggal Terbit |
19 Agustus 2025 |
Kategori |
Jurnal Nasional Terakreditasi [SINTA 4] |
Penerbit |
Universitas Muhammadiyah Riau |
Kota / Negara |
Riau / Indonesia |
Volume |
15/2 |
Halaman |
202/212 |
ISSN |
2089-3353 |
E-ISSN |
2808-9162 |
URL |
https://ejurnal.umri.ac.id/index.php/JIK/article/view/9574 |
Abstrak |
Sampah plastik menjadi salah satu sumber pencemaran lingkungan yang mengkhawatirkan di Indonesia. Berbagai kampanye pengurangan plastik digencarkan, terutama melalui media sosial X (sebelumnya Twitter). Penelitian ini bertujuan untuk menganalisis sentimen masyarakat terhadap kampanye tersebut menggunakan algoritma Naïve Bayes. Data yang digunakan berupa 4.351 tweet berbahasa Indonesia yang dikumpulkan selama November 2024– April 2025 dengan kata kunci “sampah plastik”, “kurangi plastik”, dan “polusi plastik”. Proses analisis mengikuti tahapan CRISP-DM. Data diproses melalui tahapan preprocessing Data diproses melalui tahapan preprocessing seperti cleaning, tokenisasi, dan stemming, kemudian dilabeli secara otomatis menggunakan IndoBERT, sebuah model pra-terlatih berbasis BERT yang dirancang khusus untuk klasifikasi sentimen dalam bahasa Indonesia. Fitur diekstraksi dengan TF-IDF, dan model dilatih menggunakan tiga skenario pembagian data (60:40, 70:30, dan 80:20). Untuk mengatasi ketidakseimbangan kelas yang ditemukan, diterapkan teknik Random Over Sampling (ROS). ROS bekerja dengan menduplikasi data dari kelas minoritas untuk menyeimbangkan distribusi data latih, yang bertujuan agar model dapat belajar secara lebih adil. Hasil evaluasi menunjukkan bahwa tanpa ROS, model tidak mampu mengenali kelas sentimen positif (recall = 0). Namun setelah ROS diterapkan, performa model meningkat signifikan, terutama pada kelas minoritas, dengan kenaikan recall hingga lebih dari 59%. Peningkatan ini membuktikan bahwa ROS efektif dalam memperbaiki performa model untuk analisis sentimen pada data yang tidak seimbang. Penelitian ini diharapkan dapat memberikan kontribusi dalam pemanfaatan machine learning untuk memahami persepsi publik dan mendukung perumusan kebijakan lingkungan yang lebih efektif. |