Penerapan Imputasi Ganda dengan Metode Predictive Mean Matching (PMM) untuk Pendugaan Data Hilang pada Model Regresi Linear

  • Wilsen Wilsen Program Studi Matematika Universitas Negeri Jakarta
  • Widyanti Rahayu Program Studi Statistika Universitas Negeri Jakarta
  • Vera Maya Santi Program Studi Statistika Universitas Negeri Jakarta
Keywords: data hilang, regresi linear, imputasi ganda, predictive mean matching, efisiensi uji wald, uji t

Abstract

Permasalahan data hilang pada analisis regresi linear telah menjadi hal yang umum. Meskipun demikian, beberapa peneliti mengabaikan masalah data hilang. Akibatnya, tingkat ketepatan model yang diperoleh akan menurun. Bahkan, dugaan parameter yang dihasilkan cenderung bias. Salah satu teknik yang digunakan untuk mengatasi masalah data hilang pada model regresi linear adalah imputasi ganda dengan metode Predictive Mean Matching (PMM). Kajian dalam tulisan ini difokuskan untuk mengatasi permasalahan data hilang yang terdapat pada variabel bebas dengan pola monoton dan mekanisme Missing At Random (MAR). Imputasi ganda dengan metode PMM diterapkan pada kasus tingkat efisiensi bahan bakar (City mpg). Variabel bebas yang digunakan dalam kasus tersebut adalah Compression ratio, Bore, dan Stroke. Persentase data hilang sebesar 2% yang tersebar di variabel Bore dan Stroke. Hasil data imputasi memenuhi batas toleransi dari nilai efisiensi relatif sebesar 5%. Bahkan, Compression ratio, Bore, dan Stroke memberikan pengaruh yang signifikan terhadap tingkat efisiensi bahan bakar (City mpg) berdasarkan Uji Wald dan Uji t dengan taraf signfikansi sebesar 5% (α=5%).

Published
2018-08-31