Spatial Clustering Perkebunan Kelapa Sawit di Provinsi Riau Menggunakan Genetik K-Means Algorithm (GKA)

Data  spasial  merupakan sebuah  data  yang  berorientasi geografis  dan  memiliki  sistem  koordinat  tertentu  sebagai dasar  referensinya.  Data  spasial  mempunyai  dua  bagian penting  yang  membuatnya  berbeda  dari  data  lain,  yaitu informasi lokasi (spasial) dan informasi deskriptif (attribute). Data spasial dapat digunakan untuk berbagai hal pada penerapan sistem informasi, sistem terdistribusi yang dikhususkan pada geografi.

Provinsi Riau yang terletak di pulau Sumatera memiliki 12 Kabupaten/ Kota serta terdiri dari 157 Kecamatan merupakan sebuah provinsi dengan luas perkebunan Kelapa Sawit terbesar nomor 2 di Indonesia setelah Kalimantan. Sebagaimana diliris oleh BKPM pada tahun 2012 produksi kelapa sawit di Riau mencapai 2.242.649 Ton. Hal ini menandakan bahwa penyebaran perkebunan kelapa sawit di Riau sudah sangat signifikan dan memiliki potensi yang sangat besar. Dengan luasnya perkebunan tersebut kebanyakan masyarakat tidak dapat mengetahui dimana dan bagaimana keadaan pernyebaran di wilayah Riau itu, hal senada juga dirasakan oleh instansi pemerintah maupun swasta mereka sulit untuk melakukan pemantauan, membagi setiap kelas maupun membuat sebuah cluster khusus pada perkebunan kelapa sawit di Riau.

Pengelompokan (Cluster) merupakan serangkaian k data-data yang memiliki beberapa ciri-ciri yang hampir menyerupai data satu dengan data lainnya yang saling mendekati, sehingga akan terbentuk sebuah penggerombolan-penggerombolan data. Individu yang terletak dalam satu gerombol memiliki kemiripan sifat yang lebih besar dibandingkan dengan individu yang terletak digerombol yang lain (Dillon & Goldstein 1984). Penggerombolan data dibedakan menjadi 2 yaitu Hierarki dan Non-Hierarki. Pada kasus ini akan membahas mengenai metode pengelompokan Non-Hierarki.

Dalam dunia industri, salah satu metode pengelompokan Non-Hierarki yang paling populer adalah K-Means. Algoritma ini disusun atas dasar ide  yang  sederhana.  Pada  awalnya  ditentukan  berapa  cluster  yang  akan dibentuk. Sebarang obyek atau elemen pertama dalam cluster dapat dipilih untuk dijadikan sebagai titik tengah (centroid point) cluster. Metode ini mempartisi data ke dalam cluster/ kelompok sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok yang lain. Adapun tujuan dari data clustering ini adalah untuk meminimalisasikan objective function yang diset dalam proses clustering, yang pada umumnya berusaha meminimalisasikan variasi di dalam suatu cluster dan memaksimalisasikan variasi antar cluster (Yudi Agusta, 2007). Tahun 2011 Penulis pernah melakukan penelitian tentang Pengelompokan Lahan Hijau di Riau berdasarkan KDD dengan Teknik K-Means Mining. Beberapa penelitian lain yang membahas masalah pengelompokan menggunakan K-Means adalah  Deterministic Initialization of The K-Means Algorithm using Hierarchical Clustering oleh M. Emre Celebi dan kawan-kawan pada tahun 2012, serta penelitian Sri Kusumadewi dengan judul Pengelompokkan Mahasiswa Berdasarkan Nilai Body Mass Index (BMI) & Ukuran Kerangka.

Dari beberapa penelitian yang telah dikukan ternyata algoritma K-Means memiliki beberapa kelemahan diataranya adalah sulit mencapai optimum global, karena sangat tergantung dengan pemilihan awal titik pusat, tidak selalu menghasilkan varian dalam cluster yang minimum dan varian antar cluster yang maksimum. Kelemahan yang lain adalah K-Means sensitif terhadap outlier, dalam perhitungannya semua objek dimasukkan termasuk outlier sehingga cluster yang dihasilkan dipengaruhi oleh outlier (Nursinta Adi Wahanani, 2012). Demikian juga, jika dapat disimpulkan sementara bahwa algoritma K-Means harus dilakukan hybrid dengan algoritma lain pada proses awal penentuan cluster untuk memperoleh hasil cluster yang optimal. Salah satu contoh algoritma yang optimal dalam permasalahan random adalah Algoritma Genetika (Genetic Algorithm).

Pada dasarnya Algoritma Genetika adalah program komputer yang mensimulasikan proses evolusi, dengan menghasilkan kromosom-kromosom dari tiap populasi secara random dan memungkinkan kromosom tersebut berkembang biak sesuai dengan hukum-hukum evolusi yang nantinya diharapkan akan dapat menghasilkan kromosom prima atau lebih baik. Kromosom ini merepresentasikan solusi dari permasalahan yang diangkat, sehingga apabila kromosom yang baik tersebut dihasilkan, maka diharapkan solusi yang baik dari permasalahan tersebut juga didapatkan. Oleh karena itu Algoritma Genetika banyak dipakai dalam penentuan optimasi, salah satunya adalah K-Means.

Penelitian yang pernah dilakukan oleh Nursinta Adi Wahanani menyimpulkan bahwa Genetic K-Means Algorithm (GKA) lebih optimal dibandingkan K-Means pada proses optimasi, dari beberapa penelitian lain seperti jurnal Refinement of K-Means Clustering Using Genetic Algorithm oleh K. Arun Prabha dan R.Saranya, penelitian yang dilakukan oleh Kyoung-jae Kim dan Hyunchul Ahn dengan judul A recommender system using GAK-means clustering in an online shopping market juga mengatakan hal yang sama bahwa untuk melakukan clustering lebih efektif menggunakan GKA. Demikian juga dengan penelitian Ferlyna K. Wardhani dan kawan-kawan menyatakan Hasil  pengelompokan  yang  diperoleh  menunjukkan bahwa  nilai  total  within  cluster  sum  of  distances  dari pengelompokan yang telah dioptimasi dengan algoritma genetika bernilai lebih kecil dibandingkan pengelompokan menggunakan algoritma K-means sederhana. Oleh karena itu, pada penelitian ini akan dilakukan analisis pengelompokan lahan perkebunan kelapa sawit di Provinsi Riau menggunakan GKA yang divisualisasikan dalam bentuk Sistem Informasi Geografis (SIG).

Sumber Gambar:

https://kumparan.com/guru-bangsa/mengkaji-peluang-indonesia-menggugat-kebijakan-kelapa-sawit-uni-eropa-1553253554845320071

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *