ANALISIS MODEL PREDIKSI CUACA MENGGUNAKAN SUPPORT VECTOR MACHINE, GRADIENT BOOSTING, RANDOM FOREST, DAN DECISION TREE

Risanti Risanti; Widyaningrum Indrasari; Haris Suhendar

doi:10.21009/03.1201.FA18

Authors

Risanti Risanti Program Studi Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Jakarta. Jl. Rawamangun Muka No 1, Jakarta Timur 13220, Indonesia
Widyaningrum Indrasari Program Studi Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Jakarta. Jl. Rawamangun Muka No 1, Jakarta Timur 13220, Indonesia
Haris Suhendar Program Studi Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Jakarta. Jl. Rawamangun Muka No 1, Jakarta Timur 13220, Indonesia

DOI:

https://doi.org/10.21009/03.1201.FA18

Abstract

Abstrak

Machine learning dapat diaplikasikan untuk melakukan prediksi terhadap suatu data. Salah satu data yang berkaitan dengan fenomena alam yang terdokumentasi dengan baik dan dapat diakses dengan mudah adalah data kondisi cuaca. Dalam penelitian ini digunakan data kondisi cuaca untuk melakukan pengembangan model machine learning dan prediksi keadaan cuaca. Data yang digunakan terdiri dari pengukuran suhu udara, kelembaban udara, dan kecepatan angin menggunakan data BMKG Provinsi Jawa yang bersifat open source dengan selang waktu 3 jam tahun 2020 dari bulan Januari - Desember. Tujuan penelitian ini adalah untuk mendapatkan nilai akurasi, presisi, F1 score, dan recall serta membandingkan fitur yang memberikan pengaruh paling besar terhadap hasil prediksi cuaca. Model yang digunakan dalam penelitian ini adalah support vector machine, gradient boosting, random forest, dan decision tree. Perbandingan antara data training dan data test adalah 70:30. Hasil penelitian menunjukan bahwa hasil akurasi model support vector machine, gradient boosting, random forest, decision tree masing-masing sebesar 0.1697; 0.6696; 0.7918; 0.8416; 0.8280. Pada hasil terlihat bahwa random forest memiliki pengaruh paling besar terhadap hasil prediksi cuaca dengan dengan hasil akurasi 0.8416.

Kata-kata kunci: Prediksi, Cuaca, SVM, Gradient Boosting, Random Forest, Decision Tree.

Abstract

Machine learning can be applied to make predictions on a given dataset. One well-documented and easily accessible dataset related to natural phenomena is weather condition data. In this study, weather condition data is used to develop machine learning models and predict weather conditions. The data used consists of air temperature, air humidity, and wind speed measurements obtained from the BMKG (Meteorology, Climatology, and Geophysics Agency) of the Jawa Province, which are open source and collected at 3-hour intervals throughout the year 2020 from January to December. The aim of this research is to obtain accuracy, precision, F1 score, and recall values and compare the features that have the most significant influence on weather prediction outcomes. The models used in this study are support vector machine, gradient boosting, random forest, and decision tree. The data is divided into a 70% training set and a 30% test set. The research results show that the accuracy values for, support vector machine, gradient boosting, random forest, and decision tree models are 0.1697, 0.6696, 0.7918, 0.8416, and 0.8280, respectively. It can be observed that random forest has the greatest influence on weather prediction outcomes, with an accuracy value of 0.8416.

Keywords: Prediction, Weather, SVM, Gradient Boosting, Random Forest, Decision Tree.

References

[1] D. Rahmalia, T. Herlambang, “Prediksi Cuaca Menggunakan Algoritma Particle Swarm Optimization-Neural Network (PSONN),” Seminar Nasional Matematika dan Aplikasinya, Surabaya, 2017.
[2] Indo, Intan et al., “Analisis Performansi Prakiraan Cuaca Menggunakan Algoritma Machine Learning,” Jurnal Pekommas, vol. 6 no. 2, pp. 1-8, 2021.
[3] S. Chen et al., “Automated Poisoning Attacks and Defenses in Malware Detection Systems: An Adversarial Machine Learning Approach,” 2017, [Online]. Available: http://arxiv.org/abs/1706.04146.
[4] F. Nelli, “Python data analytics: With Pandas, NumPy, and Matplotlib: Second edition,” Apress Media LLC, 2018, doi: 10.1007/978-1-4842-3913-1.
[5] A. Natekin, A. Knoll, “Gradient boosting machines, a tutorial,” Front Neurorobot, vol. 7, 2013, doi: 10.3389/fnbot.2013.00021.
[6] Y. Heryadi, T. Wahyono, “Machine Learning: Konsep dan Implementasi,” Yogyakarta, 2020, [Online] Available: https://www.researchgate.net/publication/344419764.
[7] C. Bentéjac, A. Csörgő, G. Martínez-Muñoz, “A Comparative Analysis of XGBoost,” 2019, doi: 10.1007/s10462-020-09896-5
[8] M. Raju, A. J. Laxmi, “IoT based Online Load Forecasting using Machine Learning Algorithms,” Procedia Computer Science, pp. 552-560, 2020.
[9] Hemalatha et al., “Weather Prediction using Advanced Machine Learning Techniques,” Journal of Physics: Conference Series, vol. 2089, no. 1, 2021.
[10] P. Fowdur et al., “A real-time collaborative machine learning based weather forecasting system with multiple predictor locations,” Array 14, pp. 1-13, 2020.
[11] N. U. R. Ibrahim, T. F. Bacheramsyah, B. Hidayat, “Pengklasifikasian Grade Telur Ayam Negeri menggunakan Klasifikasi K-Nearest Neighbor berbasis Android,” Jurnal Teknik Energi Elektrik, vol. 6, no. 2, pp. 288-302, 2018.
[12] L. A. Utami, “Analisis Sentimen Opini Publik Berita Kebakaran Hutan Melalui Komparasi Algoritma Support Vector Machine Dan K-Nearest Neighbor Berbasis Particle Swarm Optimization,” Jurnal Pilar Nusa Mandiri, vol. 13, no. 1, pp. 103-112, 2017.
[13] M. Rangga, A. Nasution, M. Hayaty, “Perbandingan Akurasi dan Waktu Proses Algoritma K-NN dan SVM dalam Analisis Sentimen Twitter,” Jurnal Informatika, vol. 6, no. 2, pp. 212-218, 2019, [Online]. Available: http://ejournal.bsi.ac.id/ejurnal/index.php/ji.