Analisis Prediksi Biaya Asuransi Kesehatan Menggunakan Metode Machine Learning

Authors

  • Rizki Hesananda Universitas Siber Indonesia
  • Azka Fasya Universitas Krisnadwipayana
  • Muhammad Zulfariansyah Universitas Mulawarman

Keywords:

machine learning, Asuransi, Regresi, CRISP-DM

Abstract

Penelitian ini bertujuan untuk memprediksi biaya asuransi kesehatan berdasarkan data demografis dan kebiasaan individu menggunakan berbagai metode machine learning. Dataset yang digunakan berasal dari Kaggle yang berisi 1338 baris dan 7 kolom, yaitu usia (age), jenis kelamin (sex), indeks massa tubuh (bmi), jumlah anak (children), status perokok (smoker), wilayah (region), dan biaya asuransi (charges). Model Linear Regression, Ridge Regression, Random Forest, dan Support Vector Regression (SVR) diterapkan dan dievaluasi. Hasil menunjukkan bahwa model Random Forest memberikan performa terbaik dengan nilai R² sebesar 0.8667. Penelitian ini memberikan wawasan penting dalam pemodelan biaya asuransi kesehatan untuk meningkatkan akurasi prediksi dan pengambilan keputusan.

References

E. E. Silalahi, “Budaya organisasi perusahaan asuransi jiwa di Indonesia,” MIX: Jurnal Ilmiah Manajemen, vol. VII, no. 1, pp. 48–58, 2017.

P. DI Jumlah Produksi Padi Kabupaten Padang Lawas, S. Hidayat Nasution, N. Irsa Syahputri, and R. Aprilia, “Penerapan metode least square dalam prediksi jumlah produksi padi di Kabupaten Padang Lawas,” journal.ummat.ac.id, vol. 7, no. 2, pp. 128–137, 2024, doi: 10.31764/justek.vXiY.ZZZ.

U. Indonesia, “Prediksi preferensi pelanggan waralaba makanan cepat saji dengan menggunakan pendekatan data mining skripsi,” 2011.

Lindawati, “Data Mining Dengan Teknik Clustering Dalam Pengklasifikasian Data Mahasiswa Studi Kasus Prediksi Lama Studi Mahasiswa Universitas Bina Nusantara,” Universitas Stuttgart, pp. 174–180, 2008.

D. S. Saroso, H. Rudystira, and R. Hesananda, Manajemen Perkreditan: Berbasis Pola Data Digital Anomali Aktivitas. Penerbit NEM, 2024.

S. Makridakis, E. Spiliotis, and V. Assimakopoulos, “Statistical and Machine Learning forecasting methods: Concerns and ways forward,” PLoS One, vol. 13, no. 3, p. e0194889, 2018.

R. Yanto, “Implementasi Data Mining Estimasi Ketersediaan Lahan Pembuangan Sampah menggunakan Algoritma Simple Linear Regression,” Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), vol. 2, no. 1, pp. 361–366, 2018, doi: 10.29207/resti.v2i1.282.

R. Widyastuti and H. Basri, “Klasifikasi Ciri Fitur Kayu Merbau dan Kayu Jati menggunakan Support Vector Machine ( SVM ) Feature Classification of Merbau and Teak Wood using Support Vector Machine,” vol. 1, no. 2, pp. 66–71, 2020.

M. Muchtar and R. A. Muchtar, “PERBANDINGAN METODE KNN DAN SVM DALAM KLASIFIKASI KEMATANGAN BUAH MANGGA BERDASARKAN CITRA HSV DAN FITUR STATISTIK,” Jurnal Informatika dan Teknik Elektro Terapan, vol. 12, no. 2, Apr. 2024, doi: 10.23960/jitet.v12i2.4010.

A. Lestari, “PERBANDINGAN METODE REGRESI BIASA DENGAN GEOGRAPHICALLY WEIGHTED REGRESSION DALAM MEMODELKAN DATA COLUMBUS DI SOFTWARE R 2.6.1,” Al-Khwarizmi, vol. I, 2013

J. S. Saltz, “CRISP-DM for data science: strengths, weaknesses and potential next steps,” in 2021 IEEE International Conference on Big Data (Big Data), IEEE, 2021, pp. 2337–2344.

S. Peker and Ö. Kart, “Transactional data-based customer segmentation applying CRISP-DM methodology: A systematic review,” Journal of Data, Information and Management, vol. 5, no. 1, pp. 1–21, 2023.

U. Shafique and H. Qaiser, “A comparative study of data mining process models (KDD, CRISP-DM and SEMMA),” International Journal of Innovation and Scientific Research, vol. 12, no. 1, pp. 217–222, 2014.

V. Plotnikova, M. Dumas, and F. P. Milani, “Applying the CRISP-DM data mining process in the financial services industry: Elicitation of adaptation requirements,” Data Knowl Eng, vol. 139, p. 102013, 2022.

R. Wirth and J. Hipp, “CRISP-DM: Towards a standard process model for data mining,” in Proceedings of the 4th international conference on the practical applications of knowledge discovery and data mining, Springer-Verlag London, UK, 2000.

Downloads

Published

2026-01-25

Issue

Section

Sub Tema 4: Teknologi Informasi dan Kecerdasan Buatan Terintegrasi