SKOR KELAYAKAN KREDIT MENGUNAKAN PEMBELAJARAN MESIN
Keywords:
Kelayakan kredit, ESCO, LCCA, Pembelajaran Mesin, Multinominal LogitAbstract
Banyak penulis, termasuk Athey, (2017); Christopher et al., (2018); Mullainathan & Spiess, (2017); Varian, (2014) & Athey &Imbens, (2019),(Athey and Imbens 2019) telah menekankan kapasitas besar pembelajaran mesin yang dicampur dengan ekonomi aktual untuk memecahkan masalah bisnis dan kebijakan dunia nyata. Makalah ini menunjukkan bahwa model yang paling optimal harus dipilih dari pembelajaran mesin. Tujuan kami adalah untuk menggunakan teknik fitur dan pengklasifikasi pembelajaran mesin untuk meningkatkan kekuatan prediksi model regresi logistik. Akibatnya, teknik penilaian kredit kami merekomendasikan metodologi kelayakan kredit terbaik untuk penyedia layanan ESCO. Dengan kata lain, penilaian credit menggunakan model ekonometrik berasal dari tahun 1960- an, ketika industri kartu kredit meledak dan membutuhkan prosedur keputusan. Karena kesederhanaan dan interpretasi yang sederhana, regresi logistik akhirnya menjadi model penilaian standar di sektor perbankan. Sebagian besar bank internasional masih menggunakan model statistik ini, terutama skor kelayakan, untuk memperkirakan kemungkinan default untuk persyaratan modal (Basel III) atau estimasi kerugian kredit yang cepat (IFRS 9). Salah satu aplikasi awal metode pembelajaran mesin di bidang ekonomi adalah penilaian kelayakan kredit. Beberapa di antaranya adalah West (2000), Yobas, Crook, &Ross, (2000) Lessmann, Baesens, Seow, dan Thomas (2015) menganalisis 41 algoritma dengan berbagai kriteria evaluasi dan beberapa set data penilaian kredit dalam penelitian benchmarking mereka. Mereka menemukan bahwa teknik random forest, variasi acak dari pohon keputusan yang dikantongi (Breiman, 2001), mengalahkan regresi logistik dan sejak itu random forest menjadi salah satu model standar industri perbankan(Grennepois, Alvirescu, &Bombail, 2018). Bank dan perusahaan fintech telah secara progresif mengadopsi pendekatan pembelajaran mesin untuk peringkat kelayakan kredit selama dekade terakhir (Dupont, Fliche, &Yang, 2020). Namun, salah satu kelemahan paling signifikan dari pendekatan pembelajaran mesin di sektor penilaian kredit adalah ketidakmampuan mereka untuk menjelaskan dan menganalisis hasilnya. Secara keseluruhan, meskipun model kelayakan kredit unggul dalam pembelajaran mesin, tetapi itu membutuhkan sejumlah besar data mentah. Salah satu metode yang dipinjam pembelajaran mesin dari statistik adalah regresi logistik dan fungsi sigmoid adalah nama lain untuk fungsi logistik. Kurva berbentuk S yang dapat mengambarkan angka absolut mulai dari nilai 0 dan 1. Para penenliti menggunakan sigmoid untuk memetakan prediksi probabilitas dalam pembelajaran mesin. Ketika mengirim input melalui fungsi prediksi dan memberikan skor probabilitas antara 0 dan 1, penulis mengantisipasi pengklasifikasi untuk menawarkan satu set output. Model probabilitas dataset sampel kemudian diubah menjadi model regresi logistik. Penelitian ini mencoba menganalisis prediksi kelayakan kredit proyek retrofit sebagai 'default kredit' atau ‘kredit yang gagal.’ Untuk itu penulis merumuskan fungsi sigmodi untuk kelas pertama sebagai 'default,' dan model regresi logistik ‘default’ direpresentasikan sebagai P (Creditworthiness = default|credit-score). Hal ini juga dapat diungkapkan dengan cara penulis memodelkan probabilitas ‘default’ bahwa input (X) milik kelas default (Y = 1); oleh karena itu, P(X) = P(Y =1| X) dapat mewakili ‘default’ secara formal. Ketika hanya ada dua nilai yang dimasukan sebagai output prediksi suatu objek, regresi logistik adalah strategi klasifikasi biner yang paling benar dalam memprediksi output prediksi. Sebagai contoh, peneliti mungkin mengidentifikasi apakah seseorang adalah laki-laki (0) atau perempuan (1) berdasarkan usia, pendapatan tahunan, tinggi badan, berat badan, dan kriteria lainnya. Pembelajaran mesin didalam penelitian ini digunakan untuk memprediksi kelayakan skors kredit pelanggan dalam proyek pembiayaan retrofit. Proses pengembangan model prediktif MNL meliputi dataset, persiapan data, pengembangan satu set pelatihan, pemilihan algoritma, pelatihan model, pengujian model, penilaian model, dan implementasi. Untuk meningkatkan hasil prediktif, simulasi dijalan berulang beberapa kali dengan konfigurasi yang berbeda. Visualisasi temuan dapat dicapai dalam berbagai cara. Matriks kebingungan memberikan informasi tentang membandingkan hasil klasifikasi yang dilakukan oleh sistem (model) dengan hasil klasifikasi yang sebenarnya. Hasilnya menunjukkan bahwa keakuratan model diukur secara umum berdasarkan contoh yang diklasifikasikan dengan benar. Figure 1 Confusion matrix of creditworthiness of retrofitting Penulis menelaah akurasi prediktif diprioritaskan saat memilih model pembelajaran mesin. Akurasi prediktif pada model MNL memiliki empat output alternatif, yaitu False Positives (FP), True Positives (TP), False Negatives (FN), dan True Negatives (TN), kemudian penulis menghitung ambang batas yang diberikan (TN). Tingkat misklasifikasi adalah persentase prediksi yang salah dari jumlah total kasus. Tingkat misklasifikasi ditentukan oleh ambang batas yang digunakan. Oleh karena itu, prediksi ini adalah indikator akurasi prediksi yang diterima secara luas. Persentase akurasi model ini dihitung sebagai berikut: Tingkat Akurasi = FP + FN / (TP + TN + FP + FN) = 42 + 296 + 98 / (70 + 380 + 134) = 74,6 persen. Dengan kata lain, menurut perhitungan menggunakan regresi logistik multinomial, nilai akurasi data prediksi dengan data uji adalah 74,65 persen. Kurva Receiver Operating Characteristics (ROC), menunjukkan false positive rate (FPR) pada sumbu Y versus true positive rate (TPR) pada sumbu X di atas kisaran nilai ambang batas, ini merupakan teknik standar (biasanya dalam nilai persentil). Tingkat prediksi yang dihasilkan yang mengacu pada persentase prediksi yang benar di antara semua data pengujian, adalah sebagai berikut: Tingkat Prediksi = 296 / (380) = 77,894%, Tingkat Positif Palsu (FPR) = 296 / (380) = 82,22% dan True Positive Rate, disebut sebagai Recall atau 'Tingkat Sensitivitas' Temuan studi kasus ini membantu memperjelas faktor-faktor yang mempengaruhi keputusan individu dalam melaksanakan dan mengeksekusi proyek retrofit. Penelitian ini menyoroti bagaimana perusahaan ESCO menafsirkan sifat dan konsekuensi dari kontrak ESPC dan ESA. Mereka harus khawatir tentang bagaimana menghitung keuntungan retrofit, tingkat pengembalian, persentase nilai efisiensi energi yang harus dibagi, dan perkiraan penghematan biaya energi yang harus didistribusikan secara adil baik kepada pelanggan dan juga perusahaan. Pertimbangan non-keuangan termasuk instalasi dan pemeliharaan peralatan dan garansi pencahyaan juga menjadi pertimbangan perusahaan ESCO. Baik Pelanggan atau perushaan ESCO tentu akan melihat bagaimana hasil keuntungan proyek retrofit memberikan manfaat yang sama bagi mereka berdua. Pelanggan tentu juga akan sangat tertarik pada teknologi peralatan hemat energi, konsumsi daya dan estimasi tabungan, dan peralatan yang ramah lingkungan. Selama wawancara, Perusahaan ESCO juga menyatakan bahwa pelanggan sangat yakin tentang program retrofit yang mereka tawarkan.
KATA-KUNCI: Kelayakan kredit, ESCO, LCCA, Pembelajaran Mesin, Multinominal Logit