NEWS REPRESENTATION MENGGUNAKAN MATRIX METHOD
Keywords:
Information Retrieval, Matrix Method, Text MiningAbstract
Penelitian ini merupakan bagian dari data mining, yaitu bagian information retrieval dan bagian text mining. Fokus dari penelitian ini adalah menemukan cara untuk mendapatkan kembali dokumen berita online yang relevan dengan nilai threshold tertentu, dan juga untuk meningkatkan kinerja komputer saat mengambil sejumlah besar dokumen yang relevan. Dalam hal ini penulis menggunakan berita dari tiga website berita yang cukup populer di Indonesia yaitu tribunnews.com, detik.com dan liputan6.com. Untuk mencari dokumen berita yang relevan, terlebih dahulu penulis menetapkan nilai threshold dengan menghitung rata-rata nilai kemiripan dokumen yang digunakan sebagai sampel uji. Nilai ambang ini kemudian digunakan untuk menentukan nilai kesamaan dari setiap dokumen yang akan digunakan. Penulis juga menggunakan beberapa teknik dalam proses penelitian ini, seperti text mining menggunakan metode konfigurasi dan teknik penyajian dokumen berita menggunakan metode matriks dan metode tala. Terakhir, penulis menggunakan metode cosine similarity untuk menentukan tingkat kemiripan antar dokumen dengan menggunakan data temu kembali berbasis matriks. Hasil penelitian menunjukkan bahwa pendekatan dengan menggunakan metode matriks dan proses kompresi matriks memberikan hasil perhitungan yang baik, sehingga dapat diterapkan pada dokumen dalam jumlah besar