PENGGALIAN TEKS DENGAN MODEL BAG OF WORDS TERHADAP DATA TWITTER

Main Article Content

Wahyuningdiah Trisari Harsanti Putri
Retno Hendrowati

Abstract

Ketersediaan data pada beberapa sosial media memungkinkan penelusuran mengenai hal-hal yang berkaitan terhadap suatu topik atau seorang individu. Penggalian teks (text mining) merupakan proses eksaminasi sumber tertulis dalam jumlah besar guna menghasilkan informasi baru dan untuk mengubah teks yang tidak terstruktur menjadi data yang terstruktur untuk keperluan analisis. Penggalian teks mengidentifikasi fakta-fakta, hubungan-hubungan serta pernyataan yang sekiranya tidak akan ditemukan diantara data teks yang besar. Penelitian ini merupakan eksperimen penggalian teks dengan menggunakan data twit dengan kata kunci nama tiga orang kandidat calon gubernur DKI Jakarta dari twitter stream untuk kurun waktu akhir November sampai dengan Desember 2016. Data diambil dan diolah menggunakan API twitter dan Bahasa pemrograman R. Sepuluh frekuensi kata yang ditemukan untuk tiap dataset, antara lain: agus, kader, dukung, krn,madrid, pks, pilkada, kalah, data, mengejutkan, potensial, aksi, agama, islam, menista, jakarta, politik, program, ahok, pidato, survei, dki, anies, elektabilitas, dan warga.   

Kata kunci: bag of words, natural language processing,  text mining, twitter, R

Article Details

Section
Articles
Author Biographies

Wahyuningdiah Trisari Harsanti Putri, Paramadina University

Program Studi Teknik Informatika
Fakultas Ilmu Rekayasa
Universitas Paramadina

Retno Hendrowati, Paramadina University

Program Studi Teknik Informatika
Fakultas Ilmu Rekayasa
Universitas Paramadina

References

Chopra, A., Prashar, A., & Chandresh, S. (2013). Natural Language Processing. International Journal of Technology Enhancements and Emerging Engineering Research, 1(4), 131–134.

Deepu, S., Pethuru, R., & Rajaraajeswari, S. (2016). A Framework for Text Analytics using the Bag of Words (BoW) Model for Prediction. International Journal of Advanced Networking & Applications (IJANA), 320–323.

He, W., Zha, S., & Li, L. (2013). Social media competitive analysis and text mining: A case study in the pizza industry. International Journal of Information Management, 33, 464–472. https://doi.org/10.1016/j.ijinfomgt.2013.01.001

Kaplan, A. M., & Haenlein, M. (2010). Users of the world, unite! The challenges and opportunities of Social Media. Business Horizons, 53(1), 59–68. https://doi.org/10.1016/j.bushor.2009.09.003

KBBI. (2016). Entri Semantik. Retrieved January 1, 2018, from https://kbbi.kemdikbud.go.id/entri/semantik

McTear, M., Callejas, Z., & Griol, D. (2016). The Conversational Interface: Talking to Smart Devices. In The Conversational Interface: Talking to Smart Devices (pp. 161–185). Springer International Publishing.

Obar, J. A., & Wildman, S. (2015). Social media definition and the governance challenge: An introduction to the special issue. Telecommunications Policy, 39(9), 745–750. https://doi.org/10.1016/j.telpol.2015.07.014

Strickland, J., & Chandler, N. (n.d.). How Twitter Works. Retrieved December 15, 2016, from https://computer.howstuffworks.com/internet/social-networking/networks/twitter2.htm

T. M. Holland. (2016). The World Will Use a Zettabyte of Data in 2016 — How Much Will Your Company Consume? Retrieved November 30, 2016, from https://insights.samsung.com/2016/04/22/the-world-will-use-a-zettabyte-of-data-in-2016-how-much-will-your-company-consume/

Tala, F. Z. (2003). A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia. M.Sc. Thesis, Appendix D, pp, 39–46.