METODE ANALASIS MENGGUNAKAN ALGORITMA RANDOM FOREST UNTUK PREDIKSI BIAYA ASURANSI KESEHATAN

Authors

  • Dody Indra Sumantiawan Universitas Nasional Karangturi Semarang

DOI:

https://doi.org/10.30599/jicode.v1i1.3294

Keywords:

Asuransi , Machine learning, Python, Random Forest

Abstract

Machine learning adalah cabang ilmu komputer yang memungkinkan komputer untuk belajar tanpa diprogram secara eksplisit. Salah satu tugas utama dalam machine learning adalah prediksi, yaitu memperkirakan nilai variabel target berdasarkan variabel lain. Dalam penelitian ini algoritma Random Forest dipilih karena algoritma yang powerful untuk prediksi dan memiliki banyak keuntungan, seperti akurasi tinggi, stabilitas tinggi, dan mudah diinterpretasikan. Prediksi yang dilakukan adalah pada awalnya seorang perokok dan orang yang berat badannya tidak ideal akan membayar biaya asuransi yang lebih tinggi dibandingkan dengan orang yang tidak merokok dan orang yang memiliki berat badan ideal. Data yang digunakan dalam penelitian ini menggunakan dataset yang berasal dari https://raw.githubusercontent.com/stedy/Machine-Learning-with-R-datasets/master/insurance.csv yang diolah dengan algortima random forest. Pre-processing data merupakan proses merubah data mentah menjadi format yang bersih dan siap untuk dimodelkan dengan tahapan permbersihan data, transformasi data, pengurangan data, sampling data. Metode penelitian dilakukan dengan memeriksa data dari data yang salah atau dapat mengganggu proses analisis, melakukan analisis pada dataset serta membagi data menjadi data training dan data test. Proses pembagian data adalah 80 digunakan untuk data training dan 20 untuk data test. Proses analisis diolah dengan menggunakan bahasa pemograman python. Hasil penelitian menunjukkan hasil train 23051.135798, hasil test 45302.143621 dan hasil prediksi 5956.88 dengan y_true 5934.3798. Data dengan nilai aktual yang ditunjukan pada nilai y_true memprediksi kedekatan nilai hampir mendekati nilai aktual dengan nilai 5956.88, dan sudah mendekati hasil baik.

Downloads

Download data is not yet available.

References

B. D. F. Kurniatullah and Y. T. C. Pramudi, “Estimation of Students’ Graduation Using Multiple Linear Regression Method,” Journal of Applied Intelligent System, vol. 2, no. 1, pp. 29–36, 2017, doi: 10.33633/jais.v2i1.1415

D. I. Sumantiawan, J. E. Suseno, and W. A. Syafei, "Sentiment Analysis of Customer Reviews Using Support Vector Machine and Smote-Tomek Links For Identify Customer Satisfaction," Jurnal Sistem Informasi Bisnis, vol. 13, no. 1, pp. 1-9, Jun. 2023. https://doi.org/10.21456/vol13iss1pp1-9

E. D. Wahyuni, A. A. Arifiyanti, and M. Kustyani, “Exploratory Data Analysis dalam Konteks Klasifikasi Data Mining,” in Prosiding Nasional Rekayasa Teknologi Industri dan Informasi XIV Tahun 2019 (ReTII), 2019, pp. 263–269

E. Karamazova, T. Jusufi Zenku, and Z. Trifunov, “Analysing and Comparing the Final Grade in Mathematics by Linear Regression Using Excel and SPSS,” International Journal of Mathematics Trends and Technology, vol. 52, no. 5, pp. 334–344, 2017, doi: 10.14445/22315373/ijmtt-v52p549

I. Budiman and A. N. Akhlakulkarimah, “Aplikasi Data Mining Menggunakan Multiple Linear Regression Untuk Pengenalan Pola Curah Hujan,” Kumpulan jurnaL Ilmu Komputer (KLIK), vol. 02,no. 01, pp. 34–44, 2015

J. Supranto, Statistik, Teori dan Aplikasi. Surabaya: Penerbit Erlangga, 2016.

N. Intan, P. Hati, and S. Nugroho, “Analisis Tingkat Penerimaan Calon Konsumen Terhadap Jenis Mobil Dengan Menggunakan Metode Regresi Linier,” Jurnal Teknik Elektro Unnes, vol. 8, no. 2, pp. 50–55, 2016, doi: 10.15294/jte.v8i2.7761

S. S. Rahardjo and R. Sanusi, “Linear Regression Analysis on the Determinants of Hypertension Prevention Behavior,” Journal of Health Promotion and Behavior, vol. 4, no. 1, pp. 22–31, 2019, doi: 10.26911/thejhpb.2019.04.01.03

S. Burns, Python Machine Learning Deep Learning Tensorflow. 2018.

S. N. Waghmare and C. N. Sakhale, “Formulation of Experimental Data Based model using SPSS ( Linear Regression ) for Stirrup Making Operation by Human Powered Flywheel Motor,” International Research Journal of Engineering and Technology (IRJET), vol. 02, no. 04, pp. 461–468, 2015.

Downloads

Published

2024-02-06

How to Cite

Sumantiawan, D. I. (2024). METODE ANALASIS MENGGUNAKAN ALGORITMA RANDOM FOREST UNTUK PREDIKSI BIAYA ASURANSI KESEHATAN. JICode: Jurnal Informatika Dan Komputer, 1(1), 1–8. https://doi.org/10.30599/jicode.v1i1.3294
Abstract Views: 81 | File Views: 63