IMPLEMENTASI KLASIFIKASI KONTEN NEGATIF WEBSITE BERBASIS TEKS DENGAN NAIVE BAYES, K-NEAREST NEIGHBOR, DAN SUPPORT VECTOR MACHINE
Keywords:
Konten Negatif, Machine Learning, Web Scraping, Training, Confusion Matrix.Abstract
Perkembangan teknologi informasi memudahkan akses informasi tetapi juga meningkatkan penyebaran konten negatif seperti pornografi, perjudian, dan phishing. Penelitian ini mengembangkan model klasifikasi konten negatif berbasis teks dengan algoritma Naive Bayes, Support Vector Machine (SVM), dan K-Nearest Neighbors (KNN). Menggunakan metode kuantitatif eksperimental dan dataset dari GitHub, data diproses melalui web scraping dan pre-processing, serta fitur diekstraksi dengan TF-IDF. Model SVM menunjukkan akurasi tertinggi 82.24%, dengan sistem berhasil mengklasifikasikan konten negatif hingga 80%. Penelitian ini berkontribusi pada keamanan jaringan dengan model klasifikasi yang efektif.References
L. Yana Siregar, M. Irwan Padli Nasution Prodi Manajemen, and U. Negeri Islam Sumatera Utara, “Development of Information Technology on Increasing Business Online,” J. Ilm. Manaj. dan Bisnis, vol. 2, no. 1, pp. 71–75, 2020, [Online]. Available: https://doi.org/10.30606/hjimbhttp://journal.upp.ac.id/index.php/Hirarki
R. R. Saputri and A. H. Yunial, “OKTAL : Jurnal Ilmu Komputer dan Science Implementasi Machine learning Pada Sistem Pendeteksi URL Bermuatan Konten Negatif Menggunakan Metode Algoritma Naive Bayes Dan Support Vector Machine ,” vol. 2, no. 11, pp. 3057–3062, 2023.
J. Laaksonen and E. Oja, “Classification with learning K-Nearest Neighbors s,” in Proceedings of International Conference on Neural Networks (ICNN’96), IEEE, pp. 1480–1483. doi: 10.1109/ICNN.1996.549118.
K. Kumar Mohbey and M. Acharya, “Python for Machine learning,” Basics Python Program. A Quick Guid. Beginners, pp. 237–250, 2023, doi: 10.2174/9789815179637123010013
D. Sarkar, R. Bali, and T. Sharma, “The Python Machine learning Ecosystem,” in Practical Machine learning with Python, Berkeley, CA: Apress, 2018, pp. 67–118. doi: 10.1007/978-1-4842-3207-1_2.