Kinerja Algoritma Kmeans++ pada Pengelompokkan Dokumen Teks Pendek pada Abstrak di Jurusan Teknik Elektro Fakultas Teknik UNJ
DOI:
https://doi.org/10.21009/pinter.2.1.6Keywords:
Algoritma kmeans, Teks Pendek, Matrix ConfusionAbstract
Pengelompokkan pada dokumen teks pendek masih sulit ini dikarenakan di sparsity kata. Tujuan penelitian ini adalah untuk mengetahui kinerja algoritma k-means++ pada teks pendek dan untuk mengetahui proses pengelompokkan algoritma k-means++ pada teks
pendek di abstrak skripsi Jurusan Teknik Elektro Fakultas Teknik UNJ dilaksanakan pada
semester genap tahun ajaran 2014-2015. Penelitian ini menggunakan metode penelitian
eksperimen. Data abstrak yang digunakan sebanyak 200 abstrak. Penelitian meneliti 4 data
yaitu Data pertama adalah abstrak ilmiah di jurusan Teknik Elektro, Universitas Negri
Jakarta pada paragraf 1 sampai paragraf 3. Data kedua adalah paragraf 1 pada abstrak
ilmiah di jurusan Teknik Elektro, Universitas Negri Jakarta. Data ketiga adalah paragraf 2
pada abstrak ilmiah di jurusan Teknik Elektro, Universitas Negri Jakarta. Data keempat
adalah paragraf 3 pada abstrak ilmiah di jurusan Teknik Elektro, Universitas Negri Jakarta.
Pengujian kinerja algoritma k-means++ menggunakan matrix confusion. Berdasarkan hasil
penelitian, didapatkan kesimpulan bahwa keakurasian pada abstrak, paragraf 1 di abstrak,
paragraf 2 di abstrak, dan paragraf 3 di abstrak mencapai lebih dari 80% . Didapatkan juga
kesesuaian antar data yang diprediksi dengan hasil yang benar dari data yang
sebenarnya(presisi) pada abstrak, paragraf 1 di abstrak, paragraf 2 di abstrak, dan paragraf
3 di abstrak mencapai lebih dari 50% . Didapatkan juga peluang munculnya data relevan
yang diambil sesuai dengan query (recall) pada abstrak, paragraf 1 di abstrak, paragraf 2 di
abstrak, dan paragraf 3 di abstrak mencapai lebih dari 80%.