Analisis Perbandingan Algoritma K-Nearest Neighbor dan Decision Tree dalam Klasifikasi Tingkat Obesitas
DOI:
https://doi.org/10.30865/json.v7i2.9227Keywords:
Obesitas; Decision Tree; K-Nearest Neighbor; Hyperparameter Tuning; Machine LearningAbstract
Kasus obesitas yang terus bertambah di era digital dipengaruhi oleh perubahan gaya hidup, pola makan, aktivitas fisik, serta faktor demografis. Untuk mendukung upaya deteksi dini, penelitian ini menerapkan metode machine learning guna mengklasifikasikan tingkat obesitas berdasarkan Obesity Levels Dataset yang memuat 2.111 data individu dengan 17 variabel terkait perilaku dan kondisi fisik. Penelitian berfokus pada analisis perbandingan dua algoritma klasifikasi, yaitu K-Nearest Neighbor (KNN) dan Decision Tree, dengan tujuan menilai akurasi, presisi, recall, serta stabilitas performa kedua model setelah melalui proses optimasi. Tahapan penelitian dimulai dengan pembersihan data, imputasi nilai hilang menggunakan median, penghapusan outlier melalui metode IQR, encoding variabel kategori, serta standardisasi fitur numerik. Untuk menangani ketidakseimbangan kelas, digunakan teknik SMOTE sehingga setiap kategori kelas target memiliki distribusi yang seimbang. Model kemudian dilatih menggunakan data latih sebesar 80% dan dievaluasi pada 20% data uji. Optimasi parameter dilakukan menggunakan GridSearchCV. Pada model K-Nearest Neighbor, nilai k terbaik diperoleh pada k = 3 dengan akurasi 86,59%. Sementara itu, Decision Tree mencapai performa optimal pada konfigurasi max_depth = 10, min_samples_split = 5, dan min_samples_leaf = 1. Hasil evaluasi menunjukkan bahwa kedua algoritma mampu melakukan klasifikasi tingkat obesitas dengan baik setelah proses tuning dan penyeimbangan data. Decision Tree memberikan performa yang lebih stabil dalam mengenali pola kompleks antarvariabel, sedangkan K-Nearest Neighbor menunjukkan performa optimal pada nilai k kecil ketika data telah distandarisasi dan diseimbangkan. Penelitian ini memberikan gambaran empiris mengenai efektivitas kedua algoritma dalam pemodelan klasifikasi obesitas serta dapat menjadi dasar pengembangan sistem prediksi kesehatan berbasis machine learning yang lebih akurat dan efisien.
References
G. P. Maraya, “Analisis Hubungan Penggunaan Layanan Pesan Antar Makanan Online Dengan Pperubahan Pola Makan Generasi Z Di Jakarta Daat Pandemi Covid-19,” Univ. Binawan, pp. 18–23, 2022.
R. Suraya, A. S. V. Nababan, A. Siagian, and Z. Lubis, “Pengaruh Konsumsi Makanan Jajanan, Aktivitas Fisik, Screen Time, dan Durasi Tidur Terhadap Obesitas Pada Remaja,” J. Dunia Gizi, vol. 3, no. 2, pp. 80–87, 2021, doi: 10.33085/jdg.v3i2.4732.
T. Kristiana, D. Hermawan, U. Febriani, and A. Farich, “Hubungan Antara Pola Tidur Dan Kebiasaan Makan Junk Food Dengan Kejadian Obesitas Pada Mahasiswa Universitas Malahayati Tahun 2019,” Hum. Care J., vol. 5, no. 3, p. 750, 2020, doi: 10.32883/hcj.v5i3.758.
S. Suharsono, S. Suyanta, A. Sugiyarto, Y. Yulistanti, and L. Handayani, “Upaya Pencegahan Penyakit Tidak Menular Melalui Penyuluhan Dan Deteksi Dini,” BESIRU J. Pengabdi. Masy., vol. 2, no. 6, pp. 530–541, 2025, doi: 10.62335/besiru.v2i6.1343.
N. Rachmawati and D. W. Minarsih, “Deteksi Dini dan Edukasi Obesitas Sebagai Upaya Pencegahan Diabetes Mellitus,” vol. I, no. April, pp. 48–56, 2025.
F. Diba, “Makanan Ultra-proses, Inovasi dalam Industri Makanan Modern Ultra-processed Foods, Inovation in the Modern Food Industry,” J. Kedokt. dan Kesehatan-Fakultas Kedokt. Univ. Islam Sumatera Utara, vol. 24, no. 1, pp. 191–201, 2025, [Online]. Available: https://www.jurnal.fk.uisu.ac.id/index.php/ibnusina/article/view/798
S. Riskia, “Faktor Resiko Penyebab Obesitas Pada Remaja : Literature Review,” J. Kesehat. bertuah Indones., vol. 1, no. 2, pp. 53–64, 2024.
Nourmayansa Vidya, Ritanti, and D. Ratnawati, “Genetik Mempengaruhi Kejadian Obesitas Pada Anak Usia Sekolah,” J. Heal. Educ. Lit., vol. 5, no. 1, pp. 1–7, 2022, doi: 10.31605/j-healt.v5i1.1495.
R. G. Wardhana, G. Wang, and F. Sibuea, “Penerapan Machine Learning Dalam Prediksi Tingkat Kasus Penyakit Di Indonesia,” J. Inf. Syst. Manag., vol. 5, no. 1, pp. 40–45, 2023, doi: 10.24076/joism.2023v5i1.1136.
S. M. K. Yahya, Data Mining. CV Jejak, anggota IKAPI, 2022.
Mellya P & Erlin, “Prediksi Penyakit Stroke Menggunakan Machine Learning Dengan Algoritma Random Forest,” J. Infomedia Tek. Inform., vol. 9, no. 2, 2024.
E. Hasibuan et al., “Implementasi Machine Learning untuk Prediksi Harga Mobil Bekas dengan Algoritma Regresi Linear berbasis Web,” J. Ilm. Komputasi, vol. 21, no. 4, pp. 595–602, 2022, doi: 10.32409/jikstik.21.4.3327.
G. S. W. Prabuningrat, D. P. Hostiadi, and N. L. P. Srinadi, “Klasifikasi Deteksi Anomali Menggunakan Metode Machine Learning,” Pros. Semin. Has. Penelit. Inform. dan Komput., vol. 1, no. 2, pp. 845–850, 2024.
Muflih Ihza Rifatama, Mohammad Reza Faisal, Rudy Herteno, Irwan Budiman, and Muhammad Itqan Mazdadi, “Optimasi Algoritma K-Nearest Neighbor Dengan Seleksi Fitur Menggunakan Xgboost,” J. Inform. dan Rekayasa Elektron., vol. 6, no. 1, pp. 64–72, 2023, doi: 10.36595/jire.v6i1.723.
S. Zacksavira, C. A. Br Sebayang, J. Imanuel, and G. Br Sibarani, “Implementasi Algoritma Decision Tree untuk Deteksi Depresi Pada Pelajar,” Innov. J. Soc. Sci. Res., vol. 5, no. 3, pp. 5915–5934, 2025, doi: 10.31004/innovative.v5i3.19793.
D. Kiswanto, F. Ramadhani, N. M. Surbakti, and N. A. Nasution, “Pengembangan dan Implementasi Sistem Deteksi Serangan DDoS Berbasis Algoritma Random Forest,” vol. 6, no. 3, 2025, doi: 10.47065/bit.v5i2.2203.
S. A. Utiarahman and A. M. M. Pratama, “Penerapan Support Vector Machine dan Random Forest Classifier Untuk Klasifikasi Tingkat Obesitas,” J. Fasilkom, vol. 14, no. 3, pp. 754–760, 2024, doi: 10.37859/jf.v14i3.8104.
R. N. Prakoso, S. I. Rochim, A. Subarnas, and M. E. Kurniawan, “Perbandingan Algoritma Naïve Bayes Dan Random Forest Dalam Klasifikasi Obesitas Berdasarkan Faktor Gaya Hidup,” J. Inf. Eng. Educ. Technol., vol. 9, no. 1, pp. 11–18, 2025, doi: 10.26740/jieet.v9n1.p11-18.
S. Lonang, A. Yudhana, and M. K. Biddinika, “Analisis Komparatif Kinerja Algoritma Machine Learning untuk Deteksi Stunting,” J. Media Inform. Budidarma, vol. 7, no. 4, p. 2109, 2023, doi: 10.30865/mib.v7i4.6553.
H. T. Santoso, F. A. Felmidi, A. N. Fadhila, A. Ristyawan, and E. Daniati, “Analisis Kinerja Algoritma Data Mining pada Klasifikasi Tingkat Obesitas dengan K-Fold Cross Validation dan AUC,” Agustus, vol. 8, pp. 2549–7952, 2024.
S. Y. Sibi and A. R. Widiarti, “Klasifikasi Tingkat Obesitas Mempergunakan Algoritma KNN,” Semin. Nas. Corisindo, vol. 7, no. 2, pp. 370–375, 2022.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Jurnal Sistem Komputer dan Informatika (JSON)

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

This work is licensed under a Creative Commons Attribution 4.0 International License
Authors who publish with this journal agree to the following terms:
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under Creative Commons Attribution 4.0 International License that allows others to share the work with an acknowledgment of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgment of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (Refer to The Effect of Open Access).

