Kinerja Algoritma Kmeans++ pada Pengelompokkan Dokumen Teks Pendek pada Abstrak di Jurusan Teknik Elektro Fakultas Teknik UNJ
Abstract
Pengelompokkan pada dokumen teks pendek masih sulit ini dikarenakan di sparsity kata. Tujuan penelitian ini adalah untuk mengetahui kinerja algoritma k-means++ pada teks pendek dan untuk mengetahui proses pengelompokkan algoritma k-means++ pada teks
pendek di abstrak skripsi Jurusan Teknik Elektro Fakultas Teknik UNJ dilaksanakan pada
semester genap tahun ajaran 2014-2015. Penelitian ini menggunakan metode penelitian
eksperimen. Data abstrak yang digunakan sebanyak 200 abstrak. Penelitian meneliti 4 data
yaitu Data pertama adalah abstrak ilmiah di jurusan Teknik Elektro, Universitas Negri
Jakarta pada paragraf 1 sampai paragraf 3. Data kedua adalah paragraf 1 pada abstrak
ilmiah di jurusan Teknik Elektro, Universitas Negri Jakarta. Data ketiga adalah paragraf 2
pada abstrak ilmiah di jurusan Teknik Elektro, Universitas Negri Jakarta. Data keempat
adalah paragraf 3 pada abstrak ilmiah di jurusan Teknik Elektro, Universitas Negri Jakarta.
Pengujian kinerja algoritma k-means++ menggunakan matrix confusion. Berdasarkan hasil
penelitian, didapatkan kesimpulan bahwa keakurasian pada abstrak, paragraf 1 di abstrak,
paragraf 2 di abstrak, dan paragraf 3 di abstrak mencapai lebih dari 80% . Didapatkan juga
kesesuaian antar data yang diprediksi dengan hasil yang benar dari data yang
sebenarnya(presisi) pada abstrak, paragraf 1 di abstrak, paragraf 2 di abstrak, dan paragraf
3 di abstrak mencapai lebih dari 50% . Didapatkan juga peluang munculnya data relevan
yang diambil sesuai dengan query (recall) pada abstrak, paragraf 1 di abstrak, paragraf 2 di
abstrak, dan paragraf 3 di abstrak mencapai lebih dari 80%.