PENGGALIAN TEKS DENGAN MODEL BAG OF WORDS TERHADAP DATA TWITTER

Wahyuningdiah Trisari Harsanti Putri; Retno Hendrowati

doi:10.24912/jmstkik.v2i1.1560

PDF

Published: Sep 23, 2018

DOI: https://doi.org/10.24912/jmstkik.v2i1.1560

Keywords:

bag of words, natural language processing, text mining, twitter.

Dimensions

Altmetrics

Statistics

Read Counter : 59

Download : 154

Crossmark/ Data Version

Wahyuningdiah Trisari Harsanti Putri

Paramadina University

Retno Hendrowati

Paramadina University

Abstract

Ketersediaan data pada beberapa sosial media memungkinkan penelusuran mengenai hal-hal yang berkaitan terhadap suatu topik atau seorang individu. Penggalian teks (text mining) merupakan proses eksaminasi sumber tertulis dalam jumlah besar guna menghasilkan informasi baru dan untuk mengubah teks yang tidak terstruktur menjadi data yang terstruktur untuk keperluan analisis. Penggalian teks mengidentifikasi fakta-fakta, hubungan-hubungan serta pernyataan yang sekiranya tidak akan ditemukan diantara data teks yang besar. Penelitian ini merupakan eksperimen penggalian teks dengan menggunakan data twit dengan kata kunci nama tiga orang kandidat calon gubernur DKI Jakarta dari twitter stream untuk kurun waktu akhir November sampai dengan Desember 2016. Data diambil dan diolah menggunakan API twitter dan Bahasa pemrograman R. Sepuluh frekuensi kata yang ditemukan untuk tiap dataset, antara lain: agus, kader, dukung, krn,madrid, pks, pilkada, kalah, data, mengejutkan, potensial, aksi, agama, islam, menista, jakarta, politik, program, ahok, pidato, survei, dki, anies, elektabilitas, dan warga.

Kata kunci: bag of words, natural language processing, text mining, twitter, R

Issue

Vol. 2 No. 1 (2018): Jurnal Sains, Teknologi, Kedokteran dan Ilmu Kesehatan

Section

Articles

This work is licensed under a Jurnal Muara Sains, Teknologi, Kedokteran dan Ilmu Kesehatan Creative Commons Attribution-ShareAlike 4.0 International License.

Authors transfer copyright or assign exclusive rights to the publisher (including commercial rights)

Author Biographies

Wahyuningdiah Trisari Harsanti Putri, Paramadina University

Program Studi Teknik Informatika
Fakultas Ilmu Rekayasa
Universitas Paramadina

Retno Hendrowati, Paramadina University

Program Studi Teknik Informatika
Fakultas Ilmu Rekayasa
Universitas Paramadina

References

Chopra, A., Prashar, A., & Chandresh, S. (2013). Natural Language Processing. International Journal of Technology Enhancements and Emerging Engineering Research, 1(4), 131–134.

Deepu, S., Pethuru, R., & Rajaraajeswari, S. (2016). A Framework for Text Analytics using the Bag of Words (BoW) Model for Prediction. International Journal of Advanced Networking & Applications (IJANA), 320–323.

He, W., Zha, S., & Li, L. (2013). Social media competitive analysis and text mining: A case study in the pizza industry. International Journal of Information Management, 33, 464–472. https://doi.org/10.1016/j.ijinfomgt.2013.01.001

Kaplan, A. M., & Haenlein, M. (2010). Users of the world, unite! The challenges and opportunities of Social Media. Business Horizons, 53(1), 59–68. https://doi.org/10.1016/j.bushor.2009.09.003

KBBI. (2016). Entri Semantik. Retrieved January 1, 2018, from https://kbbi.kemdikbud.go.id/entri/semantik

McTear, M., Callejas, Z., & Griol, D. (2016). The Conversational Interface: Talking to Smart Devices. In The Conversational Interface: Talking to Smart Devices (pp. 161–185). Springer International Publishing.

Obar, J. A., & Wildman, S. (2015). Social media definition and the governance challenge: An introduction to the special issue. Telecommunications Policy, 39(9), 745–750. https://doi.org/10.1016/j.telpol.2015.07.014

Strickland, J., & Chandler, N. (n.d.). How Twitter Works. Retrieved December 15, 2016, from https://computer.howstuffworks.com/internet/social-networking/networks/twitter2.htm

T. M. Holland. (2016). The World Will Use a Zettabyte of Data in 2016 — How Much Will Your Company Consume? Retrieved November 30, 2016, from https://insights.samsung.com/2016/04/22/the-world-will-use-a-zettabyte-of-data-in-2016-how-much-will-your-company-consume/

Tala, F. Z. (2003). A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia. M.Sc. Thesis, Appendix D, pp, 39–46.

Article Sidebar

Main Article Content

Abstract

Article Details

Wahyuningdiah Trisari Harsanti Putri, Paramadina University

Retno Hendrowati, Paramadina University

References