MODEL SENTIMENT ANALYSIS BERBASIS MACHINE LEARNING UNTUK DATA GENZ-CAREER ASPIRATION MENGGUNAKAN FLASK DAN NAIVE BAYES
Machine Learning Based Sentiment Analysis Model For Genz-Career Aspiration Data Using Flask and Naive Bayes
Abstract
Penulisan tugas akhir ini bertujuan untuk membangun aplikasi berbasis web untuk melakukan sentiment analysis terhadap aspirasi karier Generasi Z, menggunakan framework Flask dan algoritma Naive Bayes. Penelitian ini berfokus pada analisis dataset “GenZ - Career Aspirations Data” yang mencakup tanggapan terkait pengaruh karier, rencana pendidikan, dan loyalitas terhadap pemberi kerja. Data yang diperoleh diolah melalui tahapan preprocessing, tokenisasi, penghapusan stopwords, dan representasi TF-IDF untuk mempersiapkan data bagi model pembelajaran mesin. Aplikasi yang dirancang berfungsi untuk menganalisis sentimen teks secara real-time dengan tingkat akurasi tinggi. Metode pengembangan sistem yang digunakan adalah metode Waterfall, meliputi analisis kebutuhan, perancangan, implementasi, pengujian, dan evaluasi. Hasil akhir dari tugas akhir ini adalah prototipe aplikasi berbasis web yang mampu memprediksi sentimen positif dan negatif dari input teks, dengan akurasi model sebesar 91,2% setelah evaluasi menggunakan dataset uji. Dari pengujian yang dilakukan, aplikasi ini berhasil memenuhi kebutuhan pengguna untuk menganalisis sentimen aspirasi karier secara efisien, dengan antarmuka yang sederhana dan kemudahan penggunaan. Prototipe ini diharapkan dapat menjadi dasar bagi pengembangan aplikasi analisis sentimen yang lebih kompleks di masa depan
Downloads
References
[2.] Pang, B. dan Lee, L., “Opinion Mining and Sentiment Analysis”, Foundations and Trends in Information Retrieval, vol. 2, no. 1-2, pp. 1-135, 2008.
[3.] Jurafsky, D. dan Martin, J. H., “Speech and Language Processing: An Introduction to Natural Language Processing”, Computational Linguistics, and Speech Recognition, 3rd ed., Pearson, London, 2020.
[4.] Manning, C. D., Raghavan, P., dan Schütze, H., “Introduction to Information Retrieval”, Cambridge University Press, Cambridge, 2008.
[5.] Mikolov, T., Sutskever, I., Chen, K., Corrado, G. S., dan Dean, J., “Distributed Representations of Words and Phrases and Their Compositionality”, dalam Advances in Neural Information Processing Systems (NIPS), pp. 3111–3119, 2013.
[6.] Cambria, E., Schuller, B., Xia, Y., dan Havasi, C., “New Avenues in Opinion Mining and Sentiment Analysis”, IEEE Intelligent Systems, vol. 28, no. 2, pp. 15-21, 2013.
[7.] Hochreiter, S., dan Schmidhuber, J., “Long Short-Term Memory”, Neural Computation, vol. 9, no. 8, pp. 1735-1780, 1997.
[8.] Joachims, T., “Text Categorization with Support Vector Machines: Learning with Many Relevant Features”, dalam Proceedings of the European Conference on Machine Learning (ECML), pp. 137–142, 1998.
[9.] Rosa, A. S., dan Shalahuddin, M., “Rekayasa Perangkat Lunak Terstruktur dan Berorientasi Objek”, Informatika Bandung, Bandung, 2018.
[10.] Powers, D. M. W., “Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation”, Journal of Machine Learning Technologies, vol. 2, no. 1, pp. 37–63, 2011.

This work is licensed under a Creative Commons Attribution 4.0 International License.