PENGGALIAN TEKS DENGAN MODEL BAG OF WORDS TERHADAP DATA TWITTER
Main Article Content
Abstract
Ketersediaan data pada beberapa sosial media memungkinkan penelusuran mengenai hal-hal yang berkaitan terhadap suatu topik atau seorang individu. Penggalian teks (text mining) merupakan proses eksaminasi sumber tertulis dalam jumlah besar guna menghasilkan informasi baru dan untuk mengubah teks yang tidak terstruktur menjadi data yang terstruktur untuk keperluan analisis. Penggalian teks mengidentifikasi fakta-fakta, hubungan-hubungan serta pernyataan yang sekiranya tidak akan ditemukan diantara data teks yang besar. Penelitian ini merupakan eksperimen penggalian teks dengan menggunakan data twit dengan kata kunci nama tiga orang kandidat calon gubernur DKI Jakarta dari twitter stream untuk kurun waktu akhir November sampai dengan Desember 2016. Data diambil dan diolah menggunakan API twitter dan Bahasa pemrograman R. Sepuluh frekuensi kata yang ditemukan untuk tiap dataset, antara lain: agus, kader, dukung, krn,madrid, pks, pilkada, kalah, data, mengejutkan, potensial, aksi, agama, islam, menista, jakarta, politik, program, ahok, pidato, survei, dki, anies, elektabilitas, dan warga.
Kata kunci: bag of words, natural language processing, text mining, twitter, R
Article Details
This work is licensed under a Jurnal Muara Sains, Teknologi, Kedokteran dan Ilmu Kesehatan Creative Commons Attribution-ShareAlike 4.0 International License.
Authors transfer copyright or assign exclusive rights to the publisher (including commercial rights)
References
Chopra, A., Prashar, A., & Chandresh, S. (2013). Natural Language Processing. International Journal of Technology Enhancements and Emerging Engineering Research, 1(4), 131–134.
Deepu, S., Pethuru, R., & Rajaraajeswari, S. (2016). A Framework for Text Analytics using the Bag of Words (BoW) Model for Prediction. International Journal of Advanced Networking & Applications (IJANA), 320–323.
He, W., Zha, S., & Li, L. (2013). Social media competitive analysis and text mining: A case study in the pizza industry. International Journal of Information Management, 33, 464–472. https://doi.org/10.1016/j.ijinfomgt.2013.01.001
Kaplan, A. M., & Haenlein, M. (2010). Users of the world, unite! The challenges and opportunities of Social Media. Business Horizons, 53(1), 59–68. https://doi.org/10.1016/j.bushor.2009.09.003
KBBI. (2016). Entri Semantik. Retrieved January 1, 2018, from https://kbbi.kemdikbud.go.id/entri/semantik
McTear, M., Callejas, Z., & Griol, D. (2016). The Conversational Interface: Talking to Smart Devices. In The Conversational Interface: Talking to Smart Devices (pp. 161–185). Springer International Publishing.
Obar, J. A., & Wildman, S. (2015). Social media definition and the governance challenge: An introduction to the special issue. Telecommunications Policy, 39(9), 745–750. https://doi.org/10.1016/j.telpol.2015.07.014
Strickland, J., & Chandler, N. (n.d.). How Twitter Works. Retrieved December 15, 2016, from https://computer.howstuffworks.com/internet/social-networking/networks/twitter2.htm
T. M. Holland. (2016). The World Will Use a Zettabyte of Data in 2016 — How Much Will Your Company Consume? Retrieved November 30, 2016, from https://insights.samsung.com/2016/04/22/the-world-will-use-a-zettabyte-of-data-in-2016-how-much-will-your-company-consume/
Tala, F. Z. (2003). A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia. M.Sc. Thesis, Appendix D, pp, 39–46.