Penerapan Imputasi Ganda dengan Metode Predictive Mean Matching (PMM) untuk Pendugaan Data Hilang pada Model Regresi Linear
DOI:
https://doi.org/10.21009/JSA.02102Keywords:
data hilang, regresi linear, imputasi ganda, predictive mean matching, efisiensi uji wald, uji tAbstract
Permasalahan data hilang pada analisis regresi linear telah menjadi hal yang umum. Meskipun demikian, beberapa peneliti mengabaikan masalah data hilang. Akibatnya, tingkat ketepatan model yang diperoleh akan menurun. Bahkan, dugaan parameter yang dihasilkan cenderung bias. Salah satu teknik yang digunakan untuk mengatasi masalah data hilang pada model regresi linear adalah imputasi ganda dengan metode Predictive Mean Matching (PMM). Kajian dalam tulisan ini difokuskan untuk mengatasi permasalahan data hilang yang terdapat pada variabel bebas dengan pola monoton dan mekanisme Missing At Random (MAR). Imputasi ganda dengan metode PMM diterapkan pada kasus tingkat efisiensi bahan bakar (City mpg). Variabel bebas yang digunakan dalam kasus tersebut adalah Compression ratio, Bore, dan Stroke. Persentase data hilang sebesar 2% yang tersebar di variabel Bore dan Stroke. Hasil data imputasi memenuhi batas toleransi dari nilai efisiensi relatif sebesar 5%. Bahkan, Compression ratio, Bore, dan Stroke memberikan pengaruh yang signifikan terhadap tingkat efisiensi bahan bakar (City mpg) berdasarkan Uji Wald dan Uji t dengan taraf signfikansi sebesar 5% (α=5%).