Fakultas Teknologi Informasi
Implementasi Extreme Learning Machine dan Word Embedding Fasttext untuk Klasifikasi Kitab Bulughul Maraam Kategori Larangan, Anjuran dan Informasi

Implementasi Extreme Learning Machine dan Word Embedding Fasttext untuk Klasifikasi Kitab Bulughul Maraam Kategori Larangan, Anjuran dan Informasi

Pengantar

Dalam landasan ajaran agama Islam, Al-Qur'an dianggap sebagai sumber pedoman utama, dan hadis berperan sebagai penjelas dan panduan kedua setelah Al-Qur'an. Kumpulan hadis yang ditinggikan tingkat keshahihannya, seperti yang disampaikan oleh Imam Bukhari, telah menjadi sarana utama dalam menyebarkan ajaran Islam.

Namun, di tengah kemajuan teknologi saat ini, akses terhadap kumpulan hadis digital telah menjadi lebih mudah melalui berbagai format. Meskipun demikian, tantangan muncul ketika mencari hadis dengan tema spesifik, mengingat jumlah dan keragaman informasi yang ada. Penelitian ini hadir sebagai upaya untuk mengatasi kendala tersebut dengan mengimplementasikan klasifikasi hadis berdasarkan kategori, seperti anjuran, larangan, dan informasi.

Metode yang digunakan dalam penelitian ini mencakup pemanfaatan model Extreme Learning Machine (ELM) dan Word Embedding Fasttext. Penggunaan Fasttext memungkinkan representasi kata menjadi one-hot-vector, memberikan kemudahan dalam proses klasifikasi. Pengujian klasifikasi dilakukan pada dataset berisi 7008 hadis dalam bahasa Indonesia, yang diambil dari kitab Bulughul Maraam. Fokus utama penelitian adalah mengidentifikasi hadis sebagai anjuran, larangan, atau informasi.

Harapannya, hasil dari penelitian ini tidak hanya memberikan kontribusi signifikan bagi pengembangan ilmu agama Islam, tetapi juga memfasilitasi pencarian hadis dengan lebih mudah, sehingga dapat mengurangi potensi kesalahan dalam pemahaman makna hadis. Dengan menggunakan teknologi sebagai alat bantu, penelitian ini diharapkan dapat memberikan manfaat praktis bagi umat Islam dalam mendalami ajaran agama secara lebih efektif.

 

Metodologi Penelitian

 

1. Persiapan Dataset :

  • Tokenisasi Data: Dataset awal, yang berupa data mentah, akan dijalani proses tokenisasi untuk memisahkan data menjadi token-token atau perkata.
  • Stopword Removal: Langkah ini melibatkan penghapusan kata-kata umum yang ada dalam kamus bahasa Indonesia untuk mengurangi jumlah kata dan meningkatkan efisiensi proses klasifikasi.

2. Word Embbeding Fasttext:

Menggunakan teknologi Gensim dari Python, dilakukan representasi kata atau pencarian bobot kata dengan metode Word Embedding Fasttext. Proses ini mengubah data string menjadi bentuk one-hot vector, memungkinkan model untuk memahami dan memproses makna dari setiap kata.

3. Training Menggunakan Extreme Learning Machine (ELM):

ELM dipilih sebagai algoritma utama untuk melatih model klasifikasi. ELM bekerja mirip dengan otak manusia yang terdiri dari neuron-neuron. Proses klasifikasi dilakukan dalam 3 langkah:

  • Input Layers: Data awal dimasukkan ke dalam input layers untuk dilakukan seleksi.
  • Hidden Layers: Hasil dari seleksi masuk ke dalam hidden layers untuk proses selanjutnya.
  • Output Layers: Hasil klasifikasi muncul pada output layers, yang jumlahnya sesuai dengan kelas dalam penelitian ini: anjuran, larangan, dan perintah.

4. Evaluasi Model:

Performa model akan dievaluasi menggunakan metrik-metrik klasifikasi seperti akurasi, presisi, recall, dan F1-score. Pengujian dilakukan menggunakan dataset uji yang tidak pernah dilihat oleh model selama tahap pelatihan.

5. Optimasi dan Validasi:

Model akan dioptimalkan berdasarkan hasil evaluasi. Pengujian dilakukan dengan menggunakan dataset validasi yang tidak digunakan selama tahap pelatihan untuk memastikan generalisasi model.

 

Dengan menggunakan pendekatan ini, diharapkan sistem yang dikembangkan dapat membantu umat Islam dalam mencari hadis berdasarkan kategori tertentu, menyediakan solusi yang efisien, dan meningkatkan kemudahan dalam memahami ajaran Islam yang terkandung dalam hadis.

Hasil Penelitian

1. Pengumpulan dan Pelabelan Data:

  • Data hadis dikumpulkan melalui pencarian kitab Bulughul Maraam dalam bentuk digital untuk kemudahan pengambilan. Tim penulis melakukan validasi data dengan kitab fisik untuk memastikan keabsahannya.
  • Total data hadis yang berhasil dikumpulkan adalah sebanyak 7008, dengan sampel data awal yang mencakup teks Arab dan terjemahan hadis berbahasa Indonesia.

2. Pelabelan

  • Data hadis dibagi menjadi tiga kategori utama: Anjuran, Informasi, dan Larangan.
  • Pelabelan dilakukan dengan bimbingan dan arahan dari tiga pakar atau ahli hadis, yang merupakan tokoh dari Pesantren Persatuan Islam 84 Ciganitri Bandung.

3. Preprocessing Data:

  • Proses tokenisasi dilakukan untuk memisahkan kalimat menjadi token-token atau perkata.
  • Data hadis diubah menjadi array dan kemudian diubah ke dalam bentuk one-hot matrix untuk mempermudah proses klasifikasi.

4. Evaluasi Model:

  • Pengujian dilakukan dengan beberapa metode, termasuk Random Forest, Linear SVC, Naïve Bayes Classifier, dan Word2Vec Fasttext dengan Extreme Learning Machine (ELM).
  • Hasil evaluasi menunjukkan bahwa model Word2Vec Fasttext dengan ELM menghasilkan akurasi tertinggi sebesar 86,31%.

5. Confusion Matrix

  • Confusion matrix digunakan untuk menganalisis kinerja model. Ditemukan beberapa kesalahan prediksi, seperti kelas larangan yang diprediksi sebagai informasi.

Penelitian ini berhasil mengembangkan model klasifikasi hadis berdasarkan kategori Anjuran, Informasi, dan Larangan dengan menggunakan Word2Vec Fasttext dan Extreme Learning Machine (ELM). Model ini memberikan hasil akurasi yang tinggi, meskipun terdapat beberapa kesalahan prediksi yang perlu diperbaiki. Diharapkan penelitian ini dapat memberikan kontribusi pada pengembangan ilmu agama Islam dan mempermudah akses umat Islam terhadap hadis-hadis dengan kategori spesifik.


Kesimpulan

Penelitian ini mengeksplorasi penggunaan teknologi dalam mengatasi kendala akses dan pencarian hadis dalam konteks Islam. Dengan mengimplementasikan model klasifikasi menggunakan Word2Vec Fasttext dan Extreme Learning Machine (ELM), penelitian ini berhasil menghasilkan sistem yang mampu mengidentifikasi kategori hadis, seperti Anjuran, Informasi, dan Larangan, dengan akurasi tinggi sebesar 86,31%. Proses pelabelan data melibatkan kolaborasi dengan ahli hadis dari Pesantren Persatuan Islam 84 Ciganitri Bandung, memastikan keabsahan dan keakuratan interpretasi.

Meskipun model menunjukkan performa yang memuaskan, terdapat beberapa kesalahan prediksi yang diidentifikasi melalui analisis Confusion Matrix, seperti kelas Larangan yang diprediksi sebagai Informasi. Hal ini menandakan bahwa perlu dilakukan optimalisasi lebih lanjut untuk memperbaiki kesalahan tersebut.

Keberhasilan penelitian ini bukan hanya memberikan kontribusi pada pengembangan ilmu agama Islam, tetapi juga membawa manfaat praktis bagi umat Islam dalam pencarian hadis berdasarkan kategori tertentu. Sistem yang dikembangkan dapat memfasilitasi pemahaman ajaran Islam dengan lebih efektif dan efisien.

Artikel ilmiah lengkap mengenai penelitian ini telah dipublikasi dan dapat diakses untuk mendapatkan pemahaman yang lebih mendalam. Untuk membaca lebih lanjut silakan akses artikel ilmiah di sini. Semoga penelitian ini memberikan kontribusi positif pada pemahaman agama Islam dan mempermudah akses umat Islam terhadap sumber ajaran utama mereka.