Pendeteksian Situs Web Phishing dengan Metode Klasifikasi Menggunakan Pembelajaran Mesin ANN dan SVM

Main Article Content

Benevito Hariandja

Abstract

Internet merupakan teknologi yang penting di masa yang serba digital ini. Pengguna dapat dengan mudah melakukan berbagai hal mulai dari mencari informasi hingga melakukan transaksi dengan mengunjungi situs di internet. Dengan kemajuan internet ini, banyak juga pelaku penipuan yang membuat situs untuk menarget orang awam yang tidak jeli atau paham untuk mencuri informasi sensitif mereka seperti data, kata sandi, dan berbagai kredensial privat lainnya. Potensi penerapan pembelajaran mesin untuk validasi keaslian situs menjadi salah satu hal yang bisa diterapkan untuk menjaga pengguna. Pembelajaran mesin dapat digunakan untuk membantu manusia mengklasifikasi dan mendeteksi adanya situs yang berbahaya dan juga untuk mencegah terjadinya penipuan dalam skala besar. Pada penelitian ini algoritma pembelajaran mesin yang digunakan adalah Artificial Neural Network (ANN) dan Support Vector Machine (SVM) yang dilatih dari dataset yang mengambil situs-situs di internet. Dari eksperimen dan tes yang dilakukan, akurasi pembelajaran mesin menghasilkan hasil yang memuaskan dengan akurasi rata-rata ANN mencapai 96% dan SVM mencapai 94%. Hal ini menunjukan potensi penerapan pembelajaran mesin untuk keamanan dan pendeteksian situs yang berbahaya.

Article Details

Section
Articles

References

Alkhalil, Zainab, et al. "Phishing attacks: A recent comprehensive study and a new anatomy." Frontiers in Computer Science 3 (2021).

Alabdan, Rana. "Phishing attacks survey: Types, vectors, and technical approaches." Future internet 12.10 (2020).

Cross, Cassandra, and Rosalie Gillett. "Exploiting trust for financial gain: An overview of business email compromise (BEC) fraud." Journal of Financial Crime 27.3 (2020).

Sharif, Md Haris Uddin, and Mehmood Ali Mohammed. "A literature review of financial losses statistics for cyber security and future trend." World Journal of Advanced Research and Reviews 15.1 (2022).

Mridha, Krishna, et al. "Phishing URL classification analysis using ANN algorithm." 2021 IEEE 4th International Conference on Computing, Power and Communication Technologies (GUCON). IEEE, 2021.

Sindhu, Smita, et al. "Phishing detection using random forest, SVM and neural network with backpropagation." 2020 International Conference on Smart Technologies in Computing, Electrical and Electronics (ICSTCEE). IEEE, 2020.

Assegie, Tsehay Admassu. "K-nearest neighbor based URL identification model for phishing attack detection." Indian Journal of Artificial Intelligence and Neural Networking 1.2 (2021).

Ojewumi, Theresa O., et al. "Performance evaluation of machine learning tools for detection of phishing attacks on web pages." Scientific African 16 (2022).

Karim, Abdul, et al. "Phishing detection system through hybrid machine learning based on URL." IEEE Access 11 (2023).

Pruemmer, Julia, Tommy van Steen, and Bibi van den Berg. "A systematic review of current cybersecurity training methods." Computers & Security (2023).

Bingham, Garrett, and Risto Miikkulainen. "Discovering parametric activation functions." Neural Networks 148 (2022).

Wang, Xueliang, Honge Ren, and Achuan Wang. "Smish: A novel activation function for deep learning methods." Electronics 11.4 (2022).

Montesinos López, Osval Antonio, Abelardo Montesinos López, and Jose Crossa. "Support vector machines and support vector regression." Multivariate Statistical Machine Learning Methods for Genomic Prediction. Cham: Springer International Publishing, 2022.

Kwon, Hyun, et al. "Classification score approach for detecting adversarial example in deep neural network." Multimedia Tools and Applications 80 (2021).

Tan, Choon Lin. "Phishing dataset for machine learning: Feature evaluation." Mendeley Data 1 (2018).

Ul Hassan, Ietezaz, et al. "Significance of machine learning for detection of malicious websites on an unbalanced dataset." Digital 2.4 (2022).

Rajput, Daniyal, Wei-Jen Wang, and Chun-Chuan Chen. "Evaluation of a decided sample size in machine learning applications." BMC bioinformatics 24.1 (2023).

Althnian, Alhanoof, et al. "Impact of dataset size on classification performance: an empirical evaluation in the medical domain." Applied Sciences 11.2 (2021).

Ch, Rupa, et al. "Computational system to classify cyber crime offenses using machine learning." Sustainability 12.10 (2020).

Rácz, Anita, Dávid Bajusz, and Károly Héberger. "Effect of dataset size and train/test split ratios in QSAR/QSPR multiclass classification." Molecules 26.4 (2021).

Salazar, Jose J., et al. "Fair train-test split in machine learning: Mitigating spatial autocorrelation for improved prediction accuracy." Journal of Petroleum Science and Engineering 209 (2022).