Analisis Sentimen Naïve Bayes dengan TF-IDF dan 10-Fold pada Ulasan Aplikasi X
DOI:
https://doi.org/10.30865/json.v7i2.9007Keywords:
Naïve Bayes; Analisis Sentimen; TF-IDF; Ulasan Pengguna; Klasifikasi Teks; Penambangan DataAbstract
Penelitian ini bertujuan untuk mengidentifikasi dan mengklasifikasikan sentimen pada ulasan pengguna aplikasi X (Twitter) ke dalam kategori positif dan negatif secara otomatis untuk memperoleh gambaran objektif mengenai persepsi pengguna. Kebaruan penelitian terletak pada penerapan rangkaian preprocessing teks secara lengkap berbasis TF-IDF yang dikombinasikan dengan evaluasi model menggunakan teknik 10-fold cross-validation pada dataset berskala besar berjumlah 5.000 ulasan dari Google Play Store, sehingga menghasilkan model yang lebih akurat dan stabil dibanding pendekatan terdahulu. Metode penelitian mencakup tahapan text preprocessing (case folding, stopword removal, stemming, tokenizing, normalisasi karakter dan pembersihan simbol), transformasi TF-IDF untuk representasi numerik, dan klasifikasi menggunakan algoritma Naïve Bayes serta Support Vector Machine (SVM). Hasil penelitian menunjukkan bahwa model SVM memberikan performa tertinggi dengan akurasi rata-rata 90,02%, presisi 89,97%, recall 89,23%, dan F1-score 89,53%, melampaui Naïve Bayes yang memperoleh akurasi 87,14%, presisi 88,13%, recall 85,29%, dan F1-score 86,19%. Visualisasi wordcloud mengonfirmasi perbedaan kosakata dominan antara sentimen positif dan negatif. Temuan ini menegaskan bahwa SVM lebih unggul untuk klasifikasi sentimen berbasis teks pada ulasan aplikasi. Implikasi penelitian menunjukkan bahwa hasil analisis sentimen dapat menjadi sumber informasi berbasis data bagi pengembang dalam memetakan masalah dominan, meningkatkan kualitas layanan, dan memaksimalkan pengalaman pengguna secara berkelanjutan.
References
E. M. Thoriq, D. E. Ratnawati, and B. Rahayudi, “Analisis Sentimen Opini Publik pada Media Sosial Twitter terhadap Vaksin Covid-19 menggunakan Algoritma Support Vector Machine dan Term Frequency-Inverse Document Frequency,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 5, no. 12, pp. 5349–5355, 2021, [Online]. Available: http://j-ptiik.ub.ac.id
P. Rainer, “Negara Dengan Pengguna Twitter Terbesar Dunia,” data.goodstats.id. [Online]. Available: https://data.goodstats.id/statistic/negara-dengan-pengguna-twitter-terbesar-dunia-NcHsT?utm_source=chatgpt.com
B. J. Manurung, B. Parga Zen, Y. Setiya Rafika Nur, R. Claudio Felle, and E. Ahmad Firdaus, “Analisis Sentimen Pengguna Twitter terhadap Konflik Rusia-Ukraina Menggunakan Naïve Bayes dan Lexicon Based Features,” J. Inform., vol. 4, no. 1, pp. 8–16, 2025, doi: 10.57094/ji.v4i1.2574.
F. Herlando, A. R. Dzikrillah, F. Nufairi, E. Sinduningrum, and M. Sholeh, “Analisis Perbandingan Sentiment Dan Perbincangan Netizen Terhadap Twitter Pasca Pergantian Nama,” JIPI (Jurnal Ilm. Penelit. dan Pembelajaran Inform., vol. 9, no. 1, pp. 360–367, 2024, doi: 10.29100/jipi.v9i1.4934.
E. Aulia, “Analisis User Experience Aplikasi Twitter Menggunakan Metode User Experience Questionnaire (Ueq),” J. Tek. dan Sci., vol. 3, no. 1, pp. 31–39, 2024, doi: 10.56127/jts.v3i1.907.
E. Eskiyaturrofikoh and R. R. Suryono, “Analisis Sentimen Aplikasi X Pada Google Play Store Menggunakan Algoritma Naïve Bayes Dan Support Vector Machine (Svm),” JIPI (Jurnal Ilm. Penelit. dan Pembelajaran Inform., vol. 9, no. 3, pp. 1408–1419, 2024, doi: 10.29100/jipi.v9i3.5392.
A. Murodi, Y. Ari, and N. Setiyoko, “The Role of Social Media in Shaping Public Perception of Politics,” Formosa J. Appl. Sci., vol. 3, no. 12, pp. 4799–4812, 2024, [Online]. Available: https://journal.formosapublisher.org/index.php/fjas
T. Dzulkarnain, D. E. Ratnawati, and B. Rahayudi, “Penggunaan Metode Naïve Bayes Classifier pada Analisis Sentimen Penilaian Masyarakat Terhadap Pelayanan Rumah Sakit di Malang,” J. Teknol. Inf. dan Ilmu Komput., vol. 11, no. 5, pp. 993–1000, 2024, doi: 10.25126/jtiik.2024117979.
Alfandi Safira and F. N. Hasan, “Analisis Sentimen Masyarakat Terhadap Paylater Menggunakan Metode Naive Bayes Classifier,” Zo. J. Sist. Inf., vol. 5, no. 1, pp. 59–70, 2023, doi: 10.31849/zn.v5i1.12856.
D. Normawati and S. A. Prayogi, “Implementasi Naïve Bayes Classifier Dan Confusion Matrix Pada Analisis Sentimen Berbasis Teks Pada Twitter,” J. Sains Komput. Inform. (J-SAKTI, vol. 5, no. 2, pp. 697–711, 2021.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Jurnal Sistem Komputer dan Informatika (JSON)

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

This work is licensed under a Creative Commons Attribution 4.0 International License
Authors who publish with this journal agree to the following terms:
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under Creative Commons Attribution 4.0 International License that allows others to share the work with an acknowledgment of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgment of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (Refer to The Effect of Open Access).

