Prediksi Angka Harapan Hidup Menggunakan Random Forest dan XGBoost Regression

Authors

  • M. Bagus Prayogi Universitas Nurul Huda
  • Fitria Apriani universitas nurul huda
  • Nirma universitas nurul huda

DOI:

https://doi.org/10.30599/ht1k1h53

Keywords:

random forest, XGBoost, harapan hidup

Abstract

Angka harapan hidup mengacu pada estimasi rata-rata durasi kehidupan seseorang sejak kelahirannya. Indikator ini menjadi salah satu komponen penting dalam pengukuran indeks pembangunan manusia (IPM). Peningkatan harapan hidup biasanya berbanding lurus dengan kenaikan nilai IPM. Penelitian ini bertujuan untuk memprediksi tingkat harapan hidup menggunakan 2 algoritma regresi yaitu Random Forest regression dan XGBoost regression, serta menganalisis variabel yang paling berpengaruh terhadap harapan hidup. Dataset yang digunakan berasal dari Global Country Information Dataset 2023 yang tersedia di platform Kaggle. Berdasarkan hasil analisis, XGBoost regression terbukti memiliki performa terbaik dalam melakukan prediksi, sebagaimana ditunjukkan oleh nilai MAPE yang lebih rendah sebesar 2.60 dan R² yang lebih tinggi sebesar 90.53. Faktor-faktor seperti angka kematian bayi dan rasio kematian ibu ditemukan sebagai prediktor utama, sedangkan pengaruh Indeks Harga Konsumen (CPI) terhadap harapan hidup relatif lebih kecil.

References

[1] A. A. Kania Azzahra and D. Soebagyo, “Analisis Determinan Pertumbuhan Ekonomi di Indonesia Tahun 2000-2021,” Action Res. Lit., vol. 8, no. 3, pp. 340–345, 2024, doi: 10.46799/arl.v8i3.279.

[2] M. D. D. Akasumbawa, A. Adim, and M. G. Wibowo, “Faktor-Faktor yang Memengaruhi Pertumbuhan Ekonomi di Negara dengan Jumlah Penduduk Terbesar di Dunia (Studi pada Negara China, India, Indonesia, Pakistan dan Amerika Serikat),” Welf. J. Ilmu Ekon., vol. 2, no. 1, pp. 67–74, 2021, doi: 10.37058/wlfr.v2i1.2611.

[3] R. Aprilia and S. F. Nurhayati, “Analisis Faktor-Faktor Yang Berpengaruh Terhadap Angka Harapan Hidup Di Kabupaten/Kota Se Jawa Tengah Tahun 2020-2022 Analysis of Factors That Influence Life Expectancy Rate in Districts/Cities of Central Java in 2020-2022,” J. Inov. Pembang., vol. 12, no. 2, 2024.

[4] F. Baharuddin and A. Tjahyanto, “Peningkatan Performa Klasifikasi Machine Learning Melalui Perbandingan Metode Machine Learning dan Peningkatan Dataset,” J. Sisfokom (Sistem Inf. dan Komputer), vol. 11, no. 1, pp. 25–31, 2022, doi: 10.32736/sisfokom.v11i1.1337.

[5] Wijoyo A, Saputra A, Ristanti S, Sya’ban S, Amalia M, and Febriansyah R, “Pembelajaran Machine Learning,” OKTAL (Jurnal Ilmu Komput. dan Sci., vol. 3, no. 2, pp. 375–380, 2024, [Online]. Available: https://journal.mediapublikasi.id/index.php/oktal/article/view/2305

[6] J. C. Mestika, M. O. Selan, and M. I. Qadafi, “Menjelajahi Teknik-Teknik Supervised Learning untuk Pemodelan Prediktif Menggunakan Python,” Bul. Ilm. Ilmu Komput. dan Multimed., vol. 1, no. 1, pp. 216–219, 2023, [Online]. Available: https://jurnalmahasiswa.com/index.php/biikma/article/view/101

[7] R. Supriyadi, W. Gata, N. Maulidah, and A. Fauzi, “Penerapan Algoritma Random Forest Untuk Menentukan Kualitas Anggur Merah,” E-Bisnis J. Ilm. Ekon. dan Bisnis, vol. 13, no. 2, pp. 67–75, 2020, doi: 10.51903/e-bisnis.v13i2.247.

[8] R. Siringoringo, R. Perangin Angin, and B. Rumahorbo, “Model Klasifikasi Genetic-Xgboost Dengan T-Distributed Stochastic Neighbor Embedding Pada Peramalan Pasar,” J. TIMES, vol. 11, no. 1, pp. 30–36, 2022, doi: 10.51351/jtm.11.1.2022672.

[9] S. P. Sinaga, A. Wanto, and S. Solikhun, “Implementasi Jaringan Syaraf Tiruan Resilient Backpropagation dalam Memprediksi Angka Harapan Hidup Masyarakat Sumatera Utara,” J. Infomedia, vol. 4, no. 2, p. 81, 2020, doi: 10.30811/jim.v4i2.1573.

[10] K. R. Putra, S. Umaroh, N. Fitrianti, and S. Nugraha, “RESULTANT: Data Preparation Techniques to Improve XGBoost Algorithm Performance,” MIND (Multimedia Artif. Intell. Netw. Database) J., vol. 8, no. 1, pp. 42–51, 2023, [Online]. Available: https://doi.org/10.26760/mindjournal.v8i1.42-51

[11] M. Radhi, S. Hamonangan Sinurat, D. Ryan Hamonangan Sitompul, E. Indra, and S. Informasi, “Prediksi water quality index (wqi) menggunakan algoritma regressi dengan hyper-parameter tuning,” J. Sist. Inf. dan Ilmu Komput. Prima), vol. 5, no. 1, pp. 44–50, 2021.

[12] R. C. Rohmana, D. Triwanti, P. R. Setiyaningrum, T. Perminyakan, T. Perminyakan, and T. Perminyakan, “Penerapan Machine Learning dalam Penentuan Porositas Batuan : Studi Kasus Menggunakan Regresi Linier Berganda dan Regresi KNN pada Data Log Sumur Application of Machine Learning in Rock Porosity Determination : Case Study Using Multiple Linear Regression ,” vol. 13, no. 02, pp. 42–50, 2024.

[13] M. J. Vikri et al., “RICE QUALITY IDENTIFICATION FOR INDONESIAN FOOD STANDARDS BASED ON ELECTRONIC NOSE BERDASARKAN STANDAR PANGAN INDONESIA BERBASIS,” pp. 49–60, 2025.

[14] L. Selviana, W. Afgani, and R. A. Siroj, “Correlational Research,” Innov. J. Soc. Sci. Res., vol. 4, pp. 5118–5128, 2024, [Online]. Available: https://j-innovative.org/index.php/Innovative

Downloads

Published

2025-02-27

How to Cite

Prediksi Angka Harapan Hidup Menggunakan Random Forest dan XGBoost Regression. (2025). JICode: Jurnal Informatika Dan Komputer, 2(1), 112-121. https://doi.org/10.30599/ht1k1h53