Analisis Penyeimbangan Data pada Penyakit Stroke Menggunakan SMOTE
DOI:
https://doi.org/10.30865/json.v7i1.8847Keywords:
Menyamakan Kelas, Naive Bayes, Penyakit Stroke, SMOTE, SVMAbstract
Stroke tidak hanya mempengaruhi kesehatan individu tetapi juga membebani sistem kesehatan nasional secara signifikan. Oleh karena itu, upaya deteksi dan pencegahan dini sangat penting. Penelitian ini bertujuan untuk membandingkan kinerja klasifikasi data penyakit stroke asli dan data berimbang menggunakan algoritma Support Vector Machine (SVM) dan Naive Bayes. Dataset yang digunakan adalah data publik dari Kaggle. Hasil klasifikasi pada data asli menunjukkan bahwa metode SVM dan Naive Bayes Bernoulli memiliki akurasi tertinggi sebesar 0,945. Namun, presisi tertinggi dan nilai recall masing-masing sebesar 0,584 dan 0,699 dicapai dengan metode Naive Bayes Gaussian. Sedangkan pada data berimbang, akurasi Naive Bayes Bernoulli turun menjadi 0,806, namun nilai presisi dan recall meningkat menjadi 0,808 dan 0,806. Hasil ini menunjukkan bahwa penyeimbangan data dapat meningkatkan kinerja klasifikasi dalam hal presisi dan sensitivitas.
References
Ary Prandika Siregar, Dwi Priyadi Purba, Jojor Putri Pasaribu, and Khairul Reza Bakara, “Implementasi Algoritma Random Forest Dalam Klasifikasi Diagnosis Penyakit Stroke,” J. Penelit. Rumpun Ilmu Tek., vol. 2, no. 4, pp. 155–164, 2023, doi: 10.55606/juprit.v2i4.3039.
Y. Azhar, A. K. Firdausy, and P. J. Amelia, “Perbandingan Algoritma Klasifikasi Data Mining Untuk Prediksi Penyakit Stroke,” SINTECH (Science Inf. Technol. J., vol. 5, no. 2, pp. 191–197, 2022, doi: 10.31598/sintechjournal.v5i2.1222.
N. D. Saputri, K. Khalid, and D. Rolliawati, “Komparasi penerapan metode Bagging dan Adaboost pada Algoritma C4. 5 untuk prediksi Penyakit Stroke,” Sist. J. Sist. Inf., vol. 11, no. 3, pp. 567–577, 2022, [Online]. Available: http://sistemasi.ftik.unisi.ac.id
F. A. H. Airi, T. Suprapti, and A. Bahtiar, “Komparasi Metode Klasifikasi Data Mining Untuk Prediksi Penyakit Stroke,” E-Link J. Tek. Elektro dan Inform., vol. 18, no. 1, p. 73, 2023, doi: 10.30587/e-link.v18i1.5271.
S. Rahayu and Y. Yamasari, “Klasifikasi Penyakit Stroke dengan Metode Support Vector Machine (SVM),” J. Informatics Comput. Sci., vol. 5, no. 03, pp. 440–446, 2024, doi: 10.26740/jinacs.v5n03.p440-446.
K. Akmal, A. Faqih, and F. Dikananda, “Perbandingan Metode Algoritma Naïve Bayes Dan K-Nearest Neighbors Untuk Klasifikasi Penyakit Stroke,” JATI (Jurnal Mhs. Tek. Inform., vol. 7, no. 1, pp. 470–477, 2023, doi: 10.36040/jati.v7i1.6367.
A. P. Wijaya, “Perbandingan Algoritma Klasifikasi Random Foresst dengan Naïve Bayes Classifier pada Studi Penyakit Berdasarkan Pola Nutrisi,” vol. 9, no. 1, pp. 429–438, 2025.
E. Martantoh, N. Yanih, T. Informatika, U. Panca, and S. Bekasi, “Implementasi Metode Naïve Bayes Untuk Klasifikasi Karakteristik Kepribadiaan Siswa Di Sekolah MTS Darussa ’ adah Menggunakan PHP MySQL,” vol. 3, no. 2, pp. 166–175, 2022.
J. Dermawan, M. Fikry, S. Agustian, and L. Oktavia, “Klasifikasi Sentimen Terhadap Topik Pindah Ibu Kota Negara Pada Twitter Menggunakan Metode Naïve Bayes Classifier,” vol. 5, pp. 600–610, 2024, doi: 10.30865/json.v5i3.7475.
J. K. Wororomi, Data Mining.
G. Ayu Ria Widiani and I. M. Mahardika Yasa, “Korelasi Tingkat Pengetahuan Terhadap Kemampuan Deteksi Dini Gejala Stroke Dengan Sikap Keluarga Terhadap Penanganan Pre Hospital,” Bina Gener. J. Kesehat., vol. 14, no. 2, pp. 25–30, 2023, doi: 10.35907/bgjk.v14i2.255.
S. Bumbungan et al., “Penerapan Particle Swarm Optimization ( PSO ) dalam Pemilihan Parameter Secara Otomatis pada Support Vector Machine ( SVM ) untuk Prediksi Kelulusan Mahasiswa Politeknik Amamapare Timika,” vol. 04, no. 1, pp. 81–93, 2023.
Y. Ayuningtyas and I. Made Suartana, “Klasifikasi Penyakit Stroke Menggunakan Support Vector Machine (SVM) dan Particle Swarm Optimization (PSO),” JINACS (Journal Informatics Comput. Sci., vol. 04, no. 04, pp. 452–457, 2023.
B. Delvika, S. Nurhidayarnis, and P. D. Rinada, “Comparison of Classification Between Naive Bayes and K-Nearest Neighbor on Diabetes Risk in Pregnant Women Perbandingan Klasifikasi Antara Naive Bayes dan K-Nearest Neighbor Terhadap Resiko Diabetes Pada Ibu Hamil,” vol. 2, no. October, pp. 68–75, 2022.
F. Zahri, F. Insani, and L. Oktavia, “Perbandingan Algoritma Naïve Bayes dan K-Nearest Neighbor (K-NN) Untuk Klasifikasi Penyakit Gagal Jantung,” JOSH J. Inf. Syst. Res., vol. 6, no. 2, pp. 997–1005, 2025, doi: 10.47065/josh.v6i2.6480.
N. S. Ramadan and D. Darwis, “Perbandingan Metode Naïve Bayes Dan Svm Untuk Sentimen Analisis Masyarakat Terhadap Serangan Ransomware Pada Data Kip-K,” J. Sist. Inf. dan Inform., vol. 8, no. 1, pp. 12–23, 2024, doi: 10.47080/simika.v8i1.3621.
Y. N. Paramitha, A. Nuryaman, A. Faisol, E. Setiawan, and D. E. Nurvazly, “Klasifikasi Penyakit Stroke Menggunakan Metode Naïve Bayes,” J. Siger Mat., vol. 04, no. 01, pp. 11–16, 2023, [Online]. Available: https://www.kaggle.com/datasets/zzettrkalpakbal/full-filled-
S. Mutmainah, “Penanganan Imbalance Data Pada Klasifikasi Kemungkinan Penyakit Stroke,” J. Sains, Nalar, dan Apl. Teknol. Inf., vol. 1, no. 1, pp. 10–16, 2021, doi: 10.20885/snati.v1i1.2.
S. Kenny Riva, S. Casi, and S. Randy Erfa, “Analisis Algoritma Support Vector Machine Dalam Klasifikasi Penyakit Stroke,” e-Proceeding Eng., vol. 9, no. 3, p. 922, 2022.
V. Kecman, “Support Vector Machines – An Introduction Support Vector Machines – An Introduction,” no. May 2005, 2014, doi: 10.1007/10984697.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Muhammad Ubay Khoiruddin, Nur Nafiiyah

This work is licensed under a Creative Commons Attribution 4.0 International License.

This work is licensed under a Creative Commons Attribution 4.0 International License
Authors who publish with this journal agree to the following terms:
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under Creative Commons Attribution 4.0 International License that allows others to share the work with an acknowledgment of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgment of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (Refer to The Effect of Open Access).

