PERANCANGAN RETRIEVE, CLUSTER, SUMMARIZE (RCS) SYSTEM DENGAN METODE MULTI FEATURES COMBINATION

Main Article Content

Joko Joko
Viny Christanti Mawardi
Tony Tony

Abstract

Retrieve, Cluster, Summarize (RCS) System merupakan sistem yang dapat digunakan untuk mencari dokumen relevan, mengelompokkan dokumen relevan, serta menghasilkan ringkasan dari setiap kelompok dokumen relevan tersebut. RCS System terdiri dari beberapa tahapan, yaitu tahap input query oleh user, tahap pencarian kumpulan dokumen yang relevan dengan query, tahap pengelompokkan kumpulan dokumen relevan ke dalam sejumlah cluster, dan tahap peringkasan setiap cluster dari dokumen relevan. Metode yang digunakan untuk sistem retrieval, clustering, dan automatic text summarization secara berturut-turut adalah Language Model (LM), K-Means, dan Multi Features Combination. Dalam proses perancangan RCS System, sistem retrieval dan sistem clustering dijalankan dengan menggunakan bantuan dari Lemur Development Toolkit yang telah disesuaikan untuk proses pengolahan dokumen bahasa Indonesia. Proses pengujian RCS System dilakukan dengan menggunakan 3000 dokumen Bahasa Indonesia, yang terdiri dari dokumen berita dengan kategori teknologi, kesehatan, dan olahraga. Hasil pengujian terhadap sistem retrieval menghasilkan nilai average precision sebesar 0,91 untuk top 10 dokumen, sistem clustering menghasilkan nilai average purity sebesar 78,32% dengan jumlah cluster sebesar 5, dan sistem automatic text summarization menghasilkan nilai average answer recall strict sebesar 80,00%.

 

Kata Kunci:

K-Means Clustering, Language Model Retrieval, Multi Features Combination Text Summarization, RCS System

Article Details

Section
Articles