Implementasi Algoritma DBSCAN untuk Pengelompokan Dokumen Al-Quran dan Hubungan Asosiasi Topik pada Al-Quran dengan Pendekatan The Concurrent Development Model

Al-Qur’an adalah kitab petunjuk hudan li an-nâs dan rahmatan li al-‘âlamin (Al-Baqarah: 97). Sebagai wujud dari makna Al-Qur’an, hudan li an-nâs berarti Al-Qur’an merupakan aturan hidup bagi umat Islam (Asfahami, 2009). Sedangkan maksud Al-Qur’an sebagai rahmatan li al-‘âlamin adalah bahwa Al-Qur’an merupakan rahmat bagi seluruh alam. Berdasarkan dua fungsi utama tersebut; hudan dan rahmatan, Al-Qur’an sebagai kalam ilahi diwahyukan Allah SWT kepada Rasulullah SAW, dengan menggunakan bahasa Arab. Karena sangat tidak mungkin dua tujuan utama tersebut dapat terealisasi dengan baik kecuali dengan menggunakan bahasa yang mudah dipahami oleh manusia itu sendiri, maka dari itu Al-Qur’an memiliki terjemahan dalam bahasa yang mudah dipahami disetiap kalangan. Tujuannya adalah untuk mempelajari Al-Qur’an dari sisi dan aspek yang dapat diterapkan dalam kehidupan sesuai dengan makna didalam Al-Qur’an itu sendiri.

Disisi lain, Al-Qur’an memiliki beberapa bagian mulai dari juz, surah, ayat dan bahkan halaman pada kitab Al-Qur’an, serta makna, arti, terjemahan hingga tafsir Al-Qur’an (Rahman, 2000). Keberadaan inilah yang menjadikan Al-Qur’an menjadi salah satu kitab yang sangat kompleks mewakili seluruh sendi kehidupan baik dunia dan ahirat sebagai tuntunan umat manusia. Al-Qur’an sebagai induk dari segala induk ilmu pengetahuan telah diceritakan dengan gamblang dan detail pada masing-masing tafsir Al-Qur’an. Demikian juga dalam setiap bagian Al-Qur’an memiliki beberapa topik yang menjadi pembahasan khsus untuk dapat diserap, dipelajari, diimplementasikan serta diamalkan.

Banyaknya para ahli dalam menafsiran Al-Qur’an disetiap periode yang memiliki cara pandang yang berbeda-beda mulai dari cara klasik hingga kontemporer yang sangat  bertentangan dengan asumsi kesakralan Al-Qur’an (Fatahilah, 2016) (Kholil dkk, 2008). Ayat-ayat yang turun selama masa kerasulan Muhammad SAW antara satu atau beberapa ayat dengan ayat yang lain diselingi beberapa waktu tidaklah segera dimodifikasikan pada masa itu. Kitab Al-Qur’an ini terdiri sejumlah surat dengan nama-nama tersendiri dan juga sejumlah ayat dengan nomor urut tersendiri. Pembagian Al-Qur’an ke dalam surat dan ayat tentu memiliki makna yang jelas. Setidaknya disamping menjadi lebih sistematis, akan memudahkan orang untuk membaca, mempelajari dan menghafalnya.

Namun demikian, pembuat maupun pencatat Al-Qur’an hingga saat ini sangat jarang sekali membagi Al-Qur’an menjadi beberapa topik khusus dalam setiap pembahsannya. Seiring dengan perkembangan zaman era modern, hal tersebut tentunya sangat membantu seseorang untuk dapat mempelajari secara khusus topik Al-Qur’an dengan berbagai kondisi. Misalnya dalam Al-Qur’an terdapat beberapa topik seperti Iman, Ilmu, Ibadah, Akhlaq dan Adab, Muamalat dan masih banyak lagi topik-topik didalam Al-Qur’an. Hal ini tentunya menjadi sebuah tuntunan ilmu yang sangat mudah untuk dipelajari bagi seseorang yang akan belajar dasar terkait dengan makna dan kandungan Al-Qur’an.

Seiring perkembangan teknologi komputer, Al-Qur’an sudah dimigrasikan menjadi sebuah aplikasi yang sering dikenal dengan Al-Qur’an Digital, Al-Qur’an Website dan Al-Qur’an Technology. Konsep yang ditawarkan dari teknologi tersebut keseluruhannya adalah untuk memudahkan seseorang dalam mempelajari, membaca, dan melakukan pencarian baik surat, ayat, juz maupun halaman pada Al-Qur’an. Hingga saat ini, dari sekian banyak aplikasi yang ditawarkan tidak adanya cakupan pembahasan terkait dengan pembagian topik-topik Al-Qur’an secara khusus. Lebih jauh dari hal tersebut, peranan yang sangat penting dari sekedar pencarian topik dalam Al-Qur’an adalah permasalahan hubungan topik dalam Al-Qur’an berdasarkan terjemahan.

Hubungan topik dalam Al-Qur’an dimaksudkan adalah untuk memudahkan dalam melakukan pembelajaran topik-topik khusus yang memiliki hubungan disetiap surat pada Al-Qur’an. Berdasarkan peneltian yang dilakukan oleh Mufhlikhah dan kawan-kawan pada tahun 2012 menyatakan bahwa terdapat hubungan dari setiap surat pada Al-Qur’an, misalnya pada Surat Al-Baqoroh memuat topik Al-Qur’an, Bangsa-bangsa terdahulu, Ibdah dan Iman. Demikian juga pada Surat Ali Imran terdapat beberapa topik diantaranya adalah Akhlaq dan adab, Al-Qur’an, Bangsa-bangsa terdahulu, Hukum Privat dan Ibadah. Dengan demikian dari penelitiannya tersebut dapat menyimpulkan bahwa antara surat Al-Baqoroh dengan Surat Ali-Imran memiliki hubungan terkait dengan topik Al-Qur’an, Bangsa-bangsa terdahulu dan Ibadah (Muflikhah, 2012). Selain itu beberapa hal yang perlu dilakukan dalam terjemahan Al-Qur’an adalah mencari hubungan keterkaitan setiap kata pada masing-masing terjemahan Al-Qur’an, misalnya kata Sholat sering beriringan dengan kata Zakat, namun kata Sholat juga sering muncul bersamaan dengan kata Puasa. Sedikitnya ada 24 tempat ayat Al-Qur’an menyebut shalat dan zakat secara beriringan (Abdurrahman bin Nashir As Sa’di, 2010). Oleh karena itu, dalam ilmu komputer terdapat suatu bidang ilmu yang dapat melakukan pengelompokan dokumen teks pada Al-Qur’an (Nur dan Mustakim, 2017) dan mampu melakukan analisis asosiasi keterkaitan antar kata pada Al-Qur’an (Rahman, 2011) yang dikenal dengan ilmu Data Mining.

Perkembangan teknologi komputasi dapat dimanfaatkan untuk berbagai keperluan menggali informasi yang terdapat pada sebuah data. Dengan munculnya teknologi seperti Data Mining dan Big Data tentunya dapat membantu menyelesaikan sebuah permasalahan baik secara teknik maupun studi kasus (Archenaa and Anita, 2015). Data Mining merupakan sebuah teknik yang menerapkan algoritma dalam menyelesaikan permasalahan kompleks (Tomar and Agarwal, 2013). Teknik Data Mining yang umum digunakan dalam penyelesaian masalah diantaranya adalah Pengelompokan (Clustering) dan Asosiasi (Association) (Jacob dan Ramani, 2012). Diantara kedua teknik tersebut, terdapat Algoritma Association Rules yang masuk kedalam Top Ten Algorithm (Agrawal, 2014) serta algoritma dengan teknik tinggi yang mampu mengelompokkan hingga menjadi beberapa bagian atau yang sering dikenal dengan DBSCAN Algorithm.

Terkait dengan Big Data dan Data Mining, terdapat satu trend yang sangat populer beberapa tahun belakangan yaitu Text Mining. Text Mining merupakan sekumpulan dokumen dalam bentuk text yang tidak beraturan membentuk sebuah data yang disusun berdasarkan kata kunci. Keberadaan Text Mining dapat dimanfaatkan untuk berbagai kepentingan seperti mendapatkan informasi dari twitter, website, dokumen elektronik serta beberapa text dokumen terstruktur seperti Al-Qur’an, hadist dan tafsir. Teknik text mining mampu menggali informasi berdasarkan struktur kata dan kalimat, keterkaitan antara satu kata dengan kata yang lain, serta dalam bentuk hubungan asosiasi.

Disamping Text Mining, dalam kajian Artificial Intelligence (AI) terdapat satu struktur penelusuran rule base dalam setiap kata dan kalimat (Rizki, 2014). Penelusuran yang dilakukan oleh sebuah algoritma dalam mencari struktur kata atau kalimat biasanya menggunakan teknik pembobotan yang akan dipadukan dengan rule base yang dikenal dengan Association Rule FP-Growth (Sinthuja, 2018). Dalam penelusuran algoritma tersebut sebuah text akan dicocokkan berdasarkan kata yang ditemukan dalam database, seberapa banyak kata yang ditemukan akan dilakukan proses pembobotan untuk menentukan hubungan dari setiap kata yang ditemukan (Soni dkk, 2013)(Ramya, 2016).

Density-Based Spatial Clustering of Application with Noise (DBSCAN) merupakan sebuah metode clustering yang membangun area berdasarkan densitas yang terkoneksi (density connected). DBSCAN adalah jenis clustering partisi dimana daerah yang densitasnya tinggi dianggap sebagai cluster sedangkan yang densitasnya rendah atau tidak tergabung dalam cluster dianggap sebagai noise (Nagpal dkk, 2011) (Suyal dkk, 2014). Keuntungan dari DBSCAN adalah tidak mengharuskan untuk mengetahui jumlah cluster, dapat menemukan bentuk kelompok sembarang dan mampu mengatasi noise (Bandyopadhyay dkk, 2013) (Mumtaz dkk, 2010). Selain itu BDSCAN dapat mengidentifikasi cluster secara sembarang, mampu mengatasi noise dan outliers, dan tidak memerlukan spesifikasi jumlah cluster yang diharapkan dalam data (Baralis dkk, 2013).

Beberapa penelitian yang telah dilakukan oleh Kondal Raj dengan membandingkan antara DBSCAN dan K-Means menunjukkan bahwa efisiensi algoritma DBSCAN lebih baik dari K-Means dan K-Medoids, dan ini adalah salah satu tools yang kuat untuk menemukan cluster berbentuk sembarang dalam database spasial yang besar (Raj, 2017). Penelitian lainnya dilakukan oleh Ester dan kawan-kawan menunjukkan bahwa DBSCAN secara signifikan lebih efektif dalam menemukan kelompok bentuk sembarang daripada algoritma CLARANS dan telah menunjukkan bahwa DBSCAN melebihi CLARANS dengan faktor minimal 100 dalam hal efisiensi (Ester et al, 1996).

Dengan demikian, pada penelitian ini akan membangun sebuah sistem berbasis web dengan pendekatan The Concurrent Development Model  yang menerapkan algoritma DBSCAN dan FP-Growth untuk mengelompokkan kata dan dokumen topik pada Al-Qur’an. Selain itu demi mewujudkan pemahaman dan kemudahan dalam mempelajari kitab Al-Qur’an, aplikasi ini juga akan merekomendasikan rule-rule base yang dapat menentukan hubungan antar kata dalam dokumen Al-Qur’an. Sistem yang dibangun dimungkinkan akan diimplementasikan dan divalidasi oleh beberapa pakar Al-Qur’an.

Sumber Gambar:

https://derwinirawan.wordpress.com/category/research-and-teaching/writing-research-and-teaching/

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *