Analisis Penyeimbangan Data pada Penyakit Stroke Menggunakan SMOTE
DOI:
https://doi.org/10.30865/json.v7i1.8847Keywords:
Menyamakan Kelas, Naive Bayes, Penyakit Stroke, SMOTE, SVMAbstract
Stroke tidak hanya mempengaruhi kesehatan individu tetapi juga membebani sistem kesehatan nasional secara signifikan. Oleh karena itu, upaya deteksi dan pencegahan dini sangat penting. Penelitian ini bertujuan untuk membandingkan kinerja klasifikasi data penyakit stroke asli dan data berimbang menggunakan algoritma Support Vector Machine (SVM) dan Naive Bayes. Dataset yang digunakan adalah data publik dari Kaggle. Hasil klasifikasi pada data asli menunjukkan bahwa metode SVM dan Naive Bayes Bernoulli memiliki akurasi tertinggi sebesar 0,945. Namun, presisi tertinggi dan nilai recall masing-masing sebesar 0,584 dan 0,699 dicapai dengan metode Naive Bayes Gaussian. Sedangkan pada data berimbang, akurasi Naive Bayes Bernoulli turun menjadi 0,806, namun nilai presisi dan recall meningkat menjadi 0,808 dan 0,806. Hasil ini menunjukkan bahwa penyeimbangan data dapat meningkatkan kinerja klasifikasi dalam hal presisi dan sensitivitas.
References
Ary Prandika Siregar, Dwi Priyadi Purba, Jojor Putri Pasaribu, and Khairul Reza Bakara, “Implementasi Algoritma Random Forest Dalam Klasifikasi Diagnosis Penyakit Stroke,” J. Penelit. Rumpun Ilmu Tek., vol. 2, no. 4, pp. 155–164, 2023, doi: 10.55606/juprit.v2i4.3039.
Y. Azhar, A. K. Firdausy, and P. J. Amelia, “Perbandingan Algoritma Klasifikasi Data Mining Untuk Prediksi Penyakit Stroke,” SINTECH (Science Inf. Technol. J., vol. 5, no. 2, pp. 191–197, 2022, doi: 10.31598/sintechjournal.v5i2.1222.
N. D. Saputri, K. Khalid, and D. Rolliawati, “Komparasi penerapan metode Bagging dan Adaboost pada Algoritma C4. 5 untuk prediksi Penyakit Stroke,” Sist. J. Sist. Inf., vol. 11, no. 3, pp. 567–577, 2022, [Online]. Available: http://sistemasi.ftik.unisi.ac.id
F. A. H. Airi, T. Suprapti, and A. Bahtiar, “Komparasi Metode Klasifikasi Data Mining Untuk Prediksi Penyakit Stroke,” E-Link J. Tek. Elektro dan Inform., vol. 18, no. 1, p. 73, 2023, doi: 10.30587/e-link.v18i1.5271.
S. Rahayu and Y. Yamasari, “Klasifikasi Penyakit Stroke dengan Metode Support Vector Machine (SVM),” J. Informatics Comput. Sci., vol. 5, no. 03, pp. 440–446, 2024, doi: 10.26740/jinacs.v5n03.p440-446.
K. Akmal, A. Faqih, and F. Dikananda, “Perbandingan Metode Algoritma Naïve Bayes Dan K-Nearest Neighbors Untuk Klasifikasi Penyakit Stroke,” JATI (Jurnal Mhs. Tek. Inform., vol. 7, no. 1, pp. 470–477, 2023, doi: 10.36040/jati.v7i1.6367.
A. P. Wijaya, “Perbandingan Algoritma Klasifikasi Random Foresst dengan Naïve Bayes Classifier pada Studi Penyakit Berdasarkan Pola Nutrisi,” vol. 9, no. 1, pp. 429–438, 2025.
E. Martantoh, N. Yanih, T. Informatika, U. Panca, and S. Bekasi, “Implementasi Metode Naïve Bayes Untuk Klasifikasi Karakteristik Kepribadiaan Siswa Di Sekolah MTS Darussa ’ adah Menggunakan PHP MySQL,” vol. 3, no. 2, pp. 166–175, 2022.
J. Dermawan, M. Fikry, S. Agustian, and L. Oktavia, “Klasifikasi Sentimen Terhadap Topik Pindah Ibu Kota Negara Pada Twitter Menggunakan Metode Naïve Bayes Classifier,” vol. 5, pp. 600–610, 2024, doi: 10.30865/json.v5i3.7475.
J. K. Wororomi, Data Mining.
G. Ayu Ria Widiani and I. M. Mahardika Yasa, “Korelasi Tingkat Pengetahuan Terhadap Kemampuan Deteksi Dini Gejala Stroke Dengan Sikap Keluarga Terhadap Penanganan Pre Hospital,” Bina Gener. J. Kesehat., vol. 14, no. 2, pp. 25–30, 2023, doi: 10.35907/bgjk.v14i2.255.
S. Bumbungan et al., “Penerapan Particle Swarm Optimization ( PSO ) dalam Pemilihan Parameter Secara Otomatis pada Support Vector Machine ( SVM ) untuk Prediksi Kelulusan Mahasiswa Politeknik Amamapare Timika,” vol. 04, no. 1, pp. 81–93, 2023.
Y. Ayuningtyas and I. Made Suartana, “Klasifikasi Penyakit Stroke Menggunakan Support Vector Machine (SVM) dan Particle Swarm Optimization (PSO),” JINACS (Journal Informatics Comput. Sci., vol. 04, no. 04, pp. 452–457, 2023.
B. Delvika, S. Nurhidayarnis, and P. D. Rinada, “Comparison of Classification Between Naive Bayes and K-Nearest Neighbor on Diabetes Risk in Pregnant Women Perbandingan Klasifikasi Antara Naive Bayes dan K-Nearest Neighbor Terhadap Resiko Diabetes Pada Ibu Hamil,” vol. 2, no. October, pp. 68–75, 2022.
F. Zahri, F. Insani, and L. Oktavia, “Perbandingan Algoritma Naïve Bayes dan K-Nearest Neighbor (K-NN) Untuk Klasifikasi Penyakit Gagal Jantung,” JOSH J. Inf. Syst. Res., vol. 6, no. 2, pp. 997–1005, 2025, doi: 10.47065/josh.v6i2.6480.
N. S. Ramadan and D. Darwis, “Perbandingan Metode Naïve Bayes Dan Svm Untuk Sentimen Analisis Masyarakat Terhadap Serangan Ransomware Pada Data Kip-K,” J. Sist. Inf. dan Inform., vol. 8, no. 1, pp. 12–23, 2024, doi: 10.47080/simika.v8i1.3621.
Y. N. Paramitha, A. Nuryaman, A. Faisol, E. Setiawan, and D. E. Nurvazly, “Klasifikasi Penyakit Stroke Menggunakan Metode Naïve Bayes,” J. Siger Mat., vol. 04, no. 01, pp. 11–16, 2023, [Online]. Available: https://www.kaggle.com/datasets/zzettrkalpakbal/full-filled-
S. Mutmainah, “Penanganan Imbalance Data Pada Klasifikasi Kemungkinan Penyakit Stroke,” J. Sains, Nalar, dan Apl. Teknol. Inf., vol. 1, no. 1, pp. 10–16, 2021, doi: 10.20885/snati.v1i1.2.
S. Kenny Riva, S. Casi, and S. Randy Erfa, “Analisis Algoritma Support Vector Machine Dalam Klasifikasi Penyakit Stroke,” e-Proceeding Eng., vol. 9, no. 3, p. 922, 2022.
V. Kecman, “Support Vector Machines – An Introduction Support Vector Machines – An Introduction,” no. May 2005, 2014, doi: 10.1007/10984697.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Muhammad Ubay Khoiruddin, Nur Nafiiyah

This work is licensed under a Creative Commons Attribution 4.0 International License.



