Implementasi K-Nearest Neighbor untuk Klasifikasi Tingkat Kemiskinan Sebagai Pendukung Pengambilan Keputusan Sosial di Indonesia
DOI:
https://doi.org/10.23969/infomatek.v28i1.26866Keywords:
K-Nearest Neighbor, Machine Learning, Decision Support System, Data Sosial Ekonomi, Kemiskinan RegionalAbstract
Kemiskinan tetap menjadi tantangan utama dalam pembangunan berkelanjutan di Indonesia, yang diperparah oleh kurangnya sistem identifikasi presisi untuk penyaluran bantuan sosial. Penelitian ini bertujuan untuk mengevaluasi efektivitas algoritma K-Nearest Neighbor (KNN) dalam mengklasifikasikan tingkat kemiskinan di 514 kabupaten/kota di Indonesia guna mendukung pengambilan keputusan kebijakan sosial yang lebih tepat sasaran. Metode yang digunakan mencakup analisis dataset dengan 12 atribut indikator sosial-ekonomi, seperti Indeks Pembangunan Manusia (IPM) dan akses sanitasi. Tahapan pra-pemrosesan data melibatkan normalisasi min-max untuk menyelaraskan skala fitur yang heterogen serta teknik Synthetic Minority Oversampling Technique (SMOTE) untuk mengatasi ketidakseimbangan distribusi kelas antara kategori "Miskin" dan "Tidak Miskin". Model divalidasi menggunakan metode 10-fold cross-validation dengan menguji variasi parameter k (3, 5, dan 7) melalui perangkat lunak RapidMiner. Hasil eksperimen menunjukkan bahwa algoritma KNN dengan parameter k=3 menghasilkan performa paling optimal dengan tingkat akurasi sebesar 89,88%. Meskipun presisi untuk kelas minoritas (miskin) tercatat sebesar 55,00%, model ini mampu mencapai nilai recall yang sangat tinggi, yakni 88,71%, serta rata-rata tertimbang F1-score sebesar 93,45%. Tingginya nilai recall menunjukkan kemampuan model dalam mendeteksi mayoritas penduduk miskin secara akurat, sehingga meminimalkan risiko pengabaian bantuan sosial. Penelitian ini menyimpulkan bahwa integrasi normalisasi dan SMOTE pada algoritma KNN secara signifikan meningkatkan sensitivitas model dalam mengidentifikasi kelompok rentan. Penggunaan model ini dianggap layak untuk kebijakan sosial inklusif karena lebih mengutamakan pengurangan kesalahan pengabaian (false negative). Namun, terdapat keterbatasan pada penggunaan data agregat wilayah yang berisiko memicu ecological fallacy. Untuk penelitian mendatang, disarankan penggunaan data tingkat rumah tangga yang lebih mikro serta integrasi indikator multidimensi yang lebih luas guna meningkatkan presisi identifikasi individu
Downloads
References
Agus Triono, T., & Sangaji, R. C. (2023). Faktor Mempengaruhi Tingkat Kemiskinan di Indonesia: Studi Literatur Laporan Data Kemiskinan BPS Tahun 2022. Journal of Society Bridge, 1(1), 59–67. https://doi.org/10.59012/jsb.v1i1.5
Amalia, W., Nur, C., Abdullah, D., & Meiyanti, R. (2025). Performance of K-Nearest Neighbor Algorithm and C4 . 5 Algorithm in Classifying Citizens Eligible to Receive Direct Cash Assistance in Bandar Mahligai Village. International Journal of Engineering, Science and Information Technology, 5(1), 368–372.
Anna, A. (2023). Pengujian Teknik Algoritma Klasifikasi Terhadap Tingkat Kemiskinan Penduduk. JTIK (Jurnal Teknik Informatika Kaputama), 7(1), 61–66. https://doi.org/10.59697/jtik.v7i1.35
Djafar, N. M., & Fauzan, A. (2024). Implementation of K-Nearest Neighbor using the oversampling technique on mixed data for the classification of household welfare status. Statistics in Transition New Series, 25(1), 109–124. https://doi.org/10.59170/stattrans-2024-007
Duwo Jiwo Saputro, A., Darmawan, A., & Nurina Sari, B. (2024). Klasifikasi Persentase Kemiskinan Di Jawa Barat Menggunakan Data Mining Algoritma K-Nearest Neighbor (Knn). JATI (Jurnal Mahasiswa Teknik Informatika), 7(4), 2718–2723. https://doi.org/10.36040/jati.v7i4.7178
Fadlullah, R., Winarno, S., & Naufal, M. (2025). Integrasi Convolutional Autoencoder dengan Support Vector Machine untuk Klasifikasi Varietas Integration of Convolutional Autoencoder with Support Vector Machine for Almond Varieties Classification. Jurnal Teknik Informatika Dan Sistem Informasi, 11(April), 63–77.
Fauziah, Tiro, M. A., & Ruliana. (2022). Comparison of k-Nearest Neighbor (k-NN) and Support Vector Machine (SVM) Methods for Classification of Poverty Data in Papua. ARRUS Journal of Mathematics and Applied Science, 2(2), 83–91. https://doi.org/10.35877/mathscience741
Fitra, R., & Rusdi, I. (2022). Penerapan Metode Algoritma K-Nearest Neighbor Menggunakan Rapidminer Studio Pada Klasifikasi Status Sosial Ekonomi Studi Kasus : Kelurahan Kapuk Muara Rt 010 Rw 04. Smart Comp: Jurnalnya Orang Pintar Komputer, 11(4), 653–660. https://doi.org/10.30591/smartcomp.v11i4.4250
Hernandes, A., Kurnia Gusti, S., Syafria, F., Handayani, L., & Ramadhani, S. (2023). Klasifikasi Data Penerimaan Zakat dengan Algoritma K-Nearest Neighbor. Media Online, 4(3), 1632–1640. https://doi.org/10.30865/klik.v4i3.1528
Kasanah, A. N., Muladi, M., & Pujianto, U. (2019). Penerapan Teknik SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Objektivitas Berita Online Menggunakan Algoritma KNN. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 3(2), 196–201. https://doi.org/10.29207/resti.v3i2.945
Komarawati, K., Nurdin, M. F., Gunawan, W., & Nurwati, R. N. (2025). Transformative capacity to build an adaptive society resilience during crisis: evidence from conditional cash transfer/PKH Indonesia. Frontiers in Sociology, 10. https://doi.org/10.3389/fsoc.2025.1507177
Lasfeto, D. B., Setyorini, T., Mauta, J. J., Bria, M., & Nenobais, O. O. N. (2024). A simple classification and clustering of poverty in rural areas using machine learning. Journal of Infrastructure Policy and Development, 8(8), 5938. https://doi.org/10.24294/jipd.v8i8.5938
Linggar Vandito, R., N. Lumban Tobing, A., Aisyah Diva Maha, R., Ali Vardan Aminudin, M., & Adinda Tasyifa, K. (2023). Implementasi Konsep Kesejahteraan, Kesetaraan dan Keadilan Sosial dalam Kebijakan Publik Provinsi DKI Jakarta pada Tahun 2022: Studi Kasus KLJ dan Relokasi Program Provinsi pada Pemukiman Kumuh. Jurnal Ilmu Sosial Dan Ilmu Politik, 5(1), 54–74. https://doi.org/10.56552/jisipol.v5i1.124
Mardiah, A., Defni, D., Lestari, A. H., Junaldi, J., & Ritmi, T. (2024). Classification of Population Data of Nagari Based on Economic Level Using The K-Nearest Neighbor Method. International Journal of Advanced Science Computing and Engineering, 6(1), 32–35. https://doi.org/10.62527/ijasce.6.1.191
Muhammad, Rino Indra Nainggolan, E. R., Putra, J. L., Sidik, S., Susafa’ati, S., & Radiyah, U. (2021). IMPLEMENTASI METODE K-NEAREST NEIGHBOR UNTUK PREDIKSI PENJUALAN KEMASAN SKINCARE PADA PT. UNIVERSAL JAYA PERKASA | Technologic.
Mukharyahya, Z. A., Astuti, Y. P., & Cahyani, O. N. (2025). Naive Bayes dan Support Vector Machine dalam Klasifikasi Tingkat Kemiskinan di Indonesia. Edumatic: Jurnal Pendidikan Informatika, 9(1), 119–128. https://doi.org/10.29408/edumatic.v9i1.29512
Muñetón-Santa, G., & Manrique-Ruiz, L. C. (2023). Predicting Multidimensional Poverty with Machine Learning Algorithms: An Open Data Source Approach Using Spatial Data. Social Sciences, 12(5), 296. https://doi.org/10.3390/socsci12050296
Nikmatun, Inna, & A., & Indra, W. (2019). Implementasi Data Mining Untuk Klasifikasi Masa Studi Mahasiswa Menggunakan Algoritma K-Nearest Neighbor. Jurnal SIMETRIS, 10(2), 421–432.
Palma, B. K., Murdiansyah, D. T., & Astuti, W. (2021). Klasifikasi Teks Artikel Berita Hoaks Covid-19 dengan Menggunakan Algotrima K-Nearest Neighbor. E-Proceeding of Engineering, 8(5), 10637–10649.
Putri, I. P. (2021). Analisis Performa Metode K- Nearest Neighbor (KNN) dan Crossvalidation pada Data Penyakit Cardiovascular. Indonesian Journal of Data and Science, 2(1), 21–28. https://doi.org/10.33096/ijodas.v2i1.25
Rivaldo, Vito Junivan, T. A. Y., & Pranoto, W. J. (2024). Perbaikan Akurasi Naïve Bayes dengan Chi-Square dan SMOTE Dalam Mengatasi High Dimensional dan Imbalanced Data Banjir. Jurnal Media Informatika Budidarma, 8(3), 1656. https://doi.org/10.30865/mib.v8i3.7886



