TOPIC MODELING DOKUMEN SKRIPSI PRODI PENDIDIKAN TEKNIK INFORMATIKA DAN KOMPUTER UNIVERSITAS NEGERI JAKARTA MENGGUNAKAN METODE LATENT DIRICHLET ALLOCATION

Authors

  • Eki Nugraha Universitas Negeri Jakarta
  • Widodo Universitas Negeri Jakarta
  • Murien Nugraheni Universitas Negeri Jakarta

DOI:

https://doi.org/10.21009/pinter.8.2.3

Keywords:

Pemodelan Topik, LDA, TF-IDF, Coherence Score, Perplexity

Abstract

Skripsi atau tugas akhir menjadi suatu syarat untuk memperoleh gelar Sarjana Strata-1 di perguruan tinggi di Indonesia. Pada program studi Pendidikan Teknik Informatika dan Komputer Universitas Negeri Jakarta mahasiswa mengambil judul dan tema skripsi yang beragam, tidak semua tema skripsi yang dibuat sesuai dengan konsentrasi jurusan masing-masing. Dengan semakin bervariasinya dokumen skripsi maka dilakukan pemodelan topik skripsi dengan menggunakan metode Latent Dirichlet Allocation untuk mengetahui komposisi topik skripsi yang dapat digunakan sebagai referensi pada penelitian selanjutnya. Bahan penelitian yang digunakan berasal dari repository admin Prodi Pendidikan Teknik Informatika dan Komputer Universitas Negeri Jakarta berupa softcopy tahun lulus 2017-2022 sebanyak 329 dokumen skripsi. Dokumen skripsi diproses melalui beberapa tahapan yaitu pre-processing yang terdiri dari case folding, stopwords,lemmatization, stemming, setelah itu dilakukan pemodelan LDA dengan menggunakan library Gensim, pembobotan kata dengan TF-IDF, pengujian topik menggunakan coherence score dan perplexity. Sehingga didapatkan 10 topik yang sering dibahas yaitu topik ke-1 mengenai Pengembangan media pembelajaran sebanyak 50 dokumen, topik ke-2 Evaluasi pembelajaran sebanyak 42 dokumen, topik ke-3 Pengembangan System informasi berbasis website sebanyak 42 dokumen, topik ke-4 Teknik komputer dan jaringan sebanyak 36 dokumen, topik ke-5 Pengembangan System informasi Universitas Negeri Jakarta berbasis website menggunakan user interface, user experience ,& backend sebanyak 36 dokumen, topik ke-6 Pengembangan dan evaluasi media pembelajaran e-learning menggunakan algoritma sebanyak 34 dokumen, topik ke-7 data mining sebanyak 28 dokumen, topik ke-8 System requirement pengembangan perangkat lunak sebanyak 26 dokumen, topik ke-9 Standar pencapaian sumber daya Pendidikan sebanyak 14 dokumen, topik ke-10 Evaluasi pengembangan website, multimedia dan jaringan sebanyak 21 dokumen. Pengujian menggunakan coherence score menghasilkan  0.2614 dan perplexity -5.9895.

Downloads

Published

2024-12-01