Prediksi Tingkat Keparahan Kanker Menggunakan Machine Learning: Studi pada Dataset Global Pasien Kanker 2015–2024

Authors

  • Rizki Hesananda Universitas Siber Indonesia
  • Tegar Witjaksono Universitas Krisnadwipayana
  • Dhany Faizal Racma Sekolah Tinggi Ilmu Komputer Yos Sudarso

Keywords:

Machine Learning, Kanker, CRISP-DM, Prediksi

Abstract

Kanker merupakan salah satu penyakit mematikan dengan prevalensi yang terus meningkat di seluruh dunia. Penelitian ini bertujuan untuk menganalisis faktor risiko kanker serta memprediksi tingkat keparahan penyakit menggunakan dataset global pasien kanker periode 2015–2024 dengan jumlah data 50.000 entri. Metode penelitian menggunakan kerangka CRISP-DM, mulai dari tahap pemahaman bisnis, pemahaman data, persiapan data, pemodelan, hingga evaluasi. Beberapa algoritma machine learning, seperti regresi linear, regresi logistik, dan random forest dibandingkan untuk menemukan model terbaik. Hasil penelitian menunjukkan bahwa random forest memberikan performa paling unggul dengan nilai R-squared sebesar 0.85 dan akurasi klasifikasi lebih dari 85%. Penelitian ini menegaskan bahwa analisis berbasis data dapat mendukung pengambilan keputusan medis dan kebijakan kesehatan yang lebih efektif.

References

D. Suryani, P. Hendriyeni, M. Mahardianti, and N. Sujati, “Konsep Dasar Kanker,” 2025, Accessed: Nov. 26, 2025. [Online]. Available: https://books.google.com/books?hl=id&lr=&id=449_EQAAQBAJ&oi=fnd&pg=PA35&dq=penyebaran+kanker+di+dunia&ots=TKFmMEkkhe&sig=ioKjFX1pBhSbJ2oh-NNGQ6qQkrE

E. M.-J. A. M. D. L. (JAMALI) and undefined 2021, “Peningkatan Pengetahuan Kanker Payudara dan Ketrampilan Periksa Payudara Sendiri (SADARI) untuk Deteksi Dini Kanker Payudara di Semutan Jatimulyo Dlingo,” journal.uii.ac.id, vol. 03, Accessed: Nov. 26, 2025. [Online]. Available: https://journal.uii.ac.id/JAMALI/article/view/17847

R. Balatif, A. S.-S. S. S. Medical, and undefined 2021, “Memahami kaitan gaya hidup dengan kanker: sebagai langkah awal pencegahan kanker,” talenta.usu.ac.id, Accessed: Nov. 26, 2025. [Online]. Available: https://talenta.usu.ac.id/scripta/article/view/4506

V. N.-G. J. K. dan Kesehatan and undefined 2023, “Kanker Serviks,” ojs.unimal.ac.id, Accessed: Nov. 26, 2025. [Online]. Available: https://ojs.unimal.ac.id/galenical/article/view/10134

S. H.-J. M. Hutama and undefined 2021, “Faktor Risiko Kanker Payudara,” jurnalmedikahutama.com, vol. 03, Accessed: Nov. 26, 2025. [Online]. Available: http://jurnalmedikahutama.com/index.php/JMH/article/view/310

U. Khabibah, … K. A.-F. H., and undefined 2022, “Faktor Risiko Kanker Serviks: Literature Review,” journal.lppm-stikesfa.ac.id, vol. 09, no. 3, pp. 270–277, 2022, Accessed: Nov. 26, 2025. [Online]. Available: https://journal.lppm-stikesfa.ac.id/index.php/FHJ/article/view/354

K. Suparna, L. S.-G. Medicina, and undefined 2022, “Kanker payudara: diagnostik, faktor risiko, dan stadium,” ejournal.undiksha.ac.id, Accessed: Nov. 26, 2025. [Online]. Available: https://ejournal.undiksha.ac.id/index.php/GM/article/view/47032

K. Q.-I. I. J. of Information and undefined 2025, “Klasifikasi Kanker Payudara Menggunakan Data Mining Tool (WEKA),” ojisnu.isnuponorogo.org, vol. 3, no. 1, 2025, Accessed: Nov. 26, 2025. [Online]. Available: https://ojisnu.isnuponorogo.org/index.php/ijitech/article/view/160

R. Rofiani, L. Oktaviani, D. Vernanda, and T. Hendriawan, “Klasifikasi jenis kanker kulit menggunakan CNN-SVM,” jurnal.mdp.ac.id, vol. 18, no. 1, Accessed: Nov. 26, 2025. [Online]. Available: https://jurnal.mdp.ac.id/index.php/algoritme/article/view/2363

J. Asian, I. S.-F. J. T. Elektro, and undefined 2021, “Teknik Data Mining untuk Prediksi Kanker Payudara yang Efisien,” fidelity.nusaputra.ac.id, Accessed: Nov. 26, 2025. [Online]. Available: https://fidelity.nusaputra.ac.id/article/view/100

R. Tio, P. Sudewo, Y. Pratama, and E. Yanti, “Analisis Data Mining Untuk Prediksi Kanker Payudara Menggunakan Algoritma Klasifikasi,” jurnal.pustakagalerimandiri.co.id, 2023, doi: 10.55382/jurnalpustakadata.v3i2.656.

R. Marzuq, … S. W.-… T. I. D., and undefined 2023, “Prediksi Kanker Paru-Paru Menggunakan Algoritme Random Forest Decision Tree,” j-ptiik.ub.ac.id, Accessed: Nov. 26, 2025. [Online]. Available: https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/12964

H. Usia et al., “Hubungan Usia dan Jenis Kelamin dengan Kejadian Kanker di RS PKU Muhammadiyah Yogyakarta,” bajangjournal.com, vol. 1, no. 2, 2021, Accessed: Nov. 26, 2025. [Online]. Available: https://bajangjournal.com/index.php/JIRK/article/view/97

A. Y. Permana, H. N. Fazri, M. Fakhrizal, N. Athoilah, M. Robi, and R. Firmansyah, “Penerapan Data Mining Dalam Analisis Prediksi Kanker Paru Menggunakan Algoritma Random Forest,” pdfs.semanticscholar.org, vol. 3, no. 2, 2023, doi: 10.55606/juitik.v3i2.472.

Y. A’yunan, … U. I.-J. T. I., and undefined 2023, “Implementasi Data Mining dalam Klasifikasi Diagnosa Kanker Payudara menggunakan Algoritma Logistic Regression,” jurnal.murnisadar.ac.id, Accessed: Nov. 26, 2025. [Online]. Available: https://jurnal.murnisadar.ac.id/index.php/Tekinkom/article/view/948

R. Rofiani, L. Oktaviani, D. Vernanda, and T. Hendriawan, “Faktor-faktor yang mempengaruhi perempuan melakukan pemeriksaan dini kanker serviks: A scoping review,” scholarhub.ui.ac.id, vol. 18, no. 1, Accessed: Nov. 26, 2025. [Online]. Available: https://scholarhub.ui.ac.id/epidkes/vol6/iss2/4/

R. Rofiani, L. Oktaviani, … D. V.-J. T., and undefined 2024, “Penerapan Metode Klasifikasi Decision Tree dalam Prediksi Kanker Paru-Paru Menggunakan Algoritma C4. 5,” pdfs.semanticscholar.org, vol. 3, no. 1, 2025, Accessed: Nov. 26, 2025. [Online]. Available: https://pdfs.semanticscholar.org/88b0/b5f22939fe8f30929840448b38075ffcd26e.pdf

H. Firda, R. Athiyah, … S. C.-J. I. J. S., and undefined 2024, “Perbandingan Algoritma Klasifikasi Data Mining Model C4. 5 Dan Naive Bayes Untuk Prediksi Keganasan Kanker Payudara,” jurnal.umj.ac.id, vol. 3, no. 1, 2025, Accessed: Nov. 26, 2025. [Online]. Available: https://jurnal.umj.ac.id/index.php/just-it/article/view/21653

V. Plotnikova, M. Dumas, and F. P. Milani, “Applying the CRISP-DM data mining process in the financial services industry: Elicitation of adaptation requirements,” Data Knowl Eng, vol. 139, p. 102013, 2022.

V. Plotnikova, M. Dumas, F. M.-D. & knowledge engineering, and undefined 2022, “Applying the CRISP-DM data mining process in the financial services industry: Elicitation of adaptation requirements,” Elsevier, Accessed: Nov. 26, 2025. [Online]. Available: https://www.sciencedirect.com/science/article/pii/S0169023X22000258

Downloads

Published

2026-01-25

Issue

Section

Sub Tema 4: Teknologi Informasi dan Kecerdasan Buatan Terintegrasi