Implementasi Machine Learning Untuk Prediksi Harga Rumah Menggunakan Algoritma Random Forest

Main Article Content

Nicholas Hadi
Jason Benedict

Abstract

Dengan pentingnya peran rumah dalam kehidupan masyarakat, banyak orang yang pasti bertujuan untuk melakukan pembelian atau penjualan rumah. Dengan banyaknya kriteria – kriteria yang dapat mempengaruhi harga rumah, membuat harga rumah sangat susah untuk di prediksi. Harga rumah tersebut tentu saja dapat diprediksi dengan menggunakan 3 algoritma Machine Learning yaitu Random Forest, Decision Tree, dan Polynomial Regression. Manfaat dalam penelitian ini adalah untuk mengetahui kriteria yang paling mempengaruhi harga rumah, dan memperlihatkan hasil akurasi dari setiap algoritma yang digunakan serta menemukan algoritma prediksi terbaik dari 3 algoritma tersebut. Penelitian ini dilakukan pada dataset harga rumah di King County, USA yang bersumber dari situs Kaggle. Dalam hasil pengujian korelasi dari 13 variabel data yang digunakan, ditemukan bahwa variabel luas rumah, grade, dan luas atas rumah mempunyai nilai pengaruh besar terhadap harga rumah. Hasil pengujian 3 algoritma tersebut dievaluasi dengan nilai R2 dan RMSE. Algoritma Random Forest dinyatakan menghasilkan prediksi terbaik dibandingkan 2 algoritma tersebut, dengan tingkat akurasi sebesar 86,54% dan nilai RMSE sebesar 144913.73.

Article Details

Section
Articles

References

P. Aji and N. S. Betha, "Random Forest Algorithm for Prediction of Precipitation," Indonesian Journal of Artificial Intelligence and Data Mining (IJAIDM), vol. 1, no. 1, pp. 27-31, 2018.

G. Soumi and B. Chandan, "A Predictive Analysis Model of Customer Purchase Behavior using Modified Random Forest Algorithm in Cloud Environment," IEEE International Conference for Convergence in Engineering, pp. 239-244, 2020.

K. D. Nariswari, D. S. Utami and Y. Soni, "Penerapan Metode Random Forest dalam Driver Analysis," Forum Statistika dan Komputasi, vol. 16, no. 1, pp. 35-43, 2011.

A. Widya, K. Ilham, B. Muhamad and H. Tri, "Prediksi Kemungkinan Diabetes pada Tahap Awal Menggunakan Algoritma Klasifikasi Random Forest," SISTEMASI: Jurnal Sistem Informasi, vol. 10, no. 1, pp. 163-171, 2021.

A. J. Yogo, P. Septiadi and C. Anna, "Analisis Perbandingan Kinerja CART Konvensional, Bagging dan Random Forest pada Klasifikasi Objek : Hasil dari Dua Simulasi," Media Statistika, vol. 12, no. 1, pp. 1-12, 2019.

M. Ari and A. W. Rika, "Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree," Scientific Journal of Informatics, vol. 3, no. 1, pp. 20-21, 2016.

L. Breiman, "Random Forests," Machine Learning, vol. 45, no. 1, pp. 5-32, 2001.

A. K. Fransiska and P. K. Angelina, "Analisis Dan Implementasi Random Forest dan Classification dan Regression Tree (CART) untuk Klasifikasi pada Misuse Intrusion Detection System," p. 7, 2011.

S. N. Yusuf and E. Nova, "Sistem Klasifikasi Variabel Tingkat Penerimaan Konsumen Terhadap Mobil Menggunakan Metode Random Forest," vol. 9, no. 1, p. 6, 2017.

S. M. Julyanti, K. Hanny and H. Djoni, "Pengembangan Model Regresi Polinomial Berganda Pada Kasus Data Pemasaran," vol. 12, no. 2, p. 150, 2012.

S. Andi, A. Septi and G. Aris, "Prediksi Harga Rumah Menggunakan Web Scrapping," Jurnal Teknik Informatika dan Sistem Informasi, vol. 8, no. 1, pp. 45-46, 2021.