Kinerja Algoritma Kmeans++ pada Pengelompokkan Dokumen Teks Pendek pada Abstrak di Jurusan Teknik Elektro Fakultas Teknik UNJ

  • Catur Rahma Sistiani Universitas Negeri Jakarta
  • Widodo Universitas Negeri Jakarta
  • Bambang Prasetya Padhi Universitas Negeri Jakarta
Keywords: Algoritma kmeans, Teks Pendek, Matrix Confusion

Abstract

Pengelompokkan pada dokumen teks pendek masih sulit ini dikarenakan di sparsity kata. Tujuan penelitian ini adalah untuk mengetahui kinerja algoritma k-means++ pada teks pendek dan untuk mengetahui proses pengelompokkan algoritma k-means++ pada teks
pendek di abstrak skripsi Jurusan Teknik Elektro Fakultas Teknik UNJ dilaksanakan pada
semester genap tahun ajaran 2014-2015. Penelitian ini menggunakan metode penelitian
eksperimen. Data abstrak yang digunakan sebanyak 200 abstrak. Penelitian meneliti 4 data
yaitu Data pertama adalah abstrak ilmiah di jurusan Teknik Elektro, Universitas Negri
Jakarta pada paragraf 1 sampai paragraf 3. Data kedua adalah paragraf 1 pada abstrak
ilmiah di jurusan Teknik Elektro, Universitas Negri Jakarta. Data ketiga adalah paragraf 2
pada abstrak ilmiah di jurusan Teknik Elektro, Universitas Negri Jakarta. Data keempat
adalah paragraf 3 pada abstrak ilmiah di jurusan Teknik Elektro, Universitas Negri Jakarta.
Pengujian kinerja algoritma k-means++ menggunakan matrix confusion. Berdasarkan hasil
penelitian, didapatkan kesimpulan bahwa keakurasian pada abstrak, paragraf 1 di abstrak,
paragraf 2 di abstrak, dan paragraf 3 di abstrak mencapai lebih dari 80% . Didapatkan juga
kesesuaian antar data yang diprediksi dengan hasil yang benar dari data yang
sebenarnya(presisi) pada abstrak, paragraf 1 di abstrak, paragraf 2 di abstrak, dan paragraf
3 di abstrak mencapai lebih dari 50% . Didapatkan juga peluang munculnya data relevan
yang diambil sesuai dengan query (recall) pada abstrak, paragraf 1 di abstrak, paragraf 2 di
abstrak, dan paragraf 3 di abstrak mencapai lebih dari 80%.

Published
2018-06-01
Section
Articles