Kayıp veriyle baş etme yöntemlerinin model veri uyumu ve madde model uyumuna etkisi
Abstract
Bu çalışmanın amacı, kayıp veri baş etme yöntemlerinin Madde Tepki Kuramı 1 parametreli lojistik modelinde model veri uyumuna ve madde model uyumuna olan etkisini incelemektir. Bu amaç doğrultusunda örneklem büyüklüğünün 500, 1000 ve 1500 olarak manipüle edildiği, madde sayısının 20 olarak sabitlendiği 1PLM’e uyumlu veri setleri üretilmiştir. Üretilen verilerde madde güçlüğü -2 ile +2 arasında sınırlandırılmış, madde ayırt ediciliği 1.5 olarak sabitlenmiştir. Üretilen eksiksiz veri setleri üzerinde tamamen rastgele kayıp ve rastgele kayıp koşulları altında %5, %10 ve %15 oranlarında silme işlemi gerçekleştirilmiştir. Tamamen rastgele kayıp mekanizması, veri setindeki toplam hücre sayısı arasından rastgele değerler silinerek oluşturulmuştur. Liste bazında silme yöntemi için belirlenen oranda rastgele birim (kişi) silinmiştir. Rastgele kayıp mekanizması, veri setine üç düzeyi olan bir değişken tanımlanıp 1. düzeyden %20, 2. düzeyden %30 ve 3. düzeyden %50 oranında olacak şekilde hücrelerin rastgele silinmesi ile oluşturulmuştur. Oluşturulan kayıp veriler liste bazında silme, regresyonla atama ve beklenti maksimizasyon algoritması yöntemleriyle giderilmiştir. Model veri uyumunun kestirilmesinde –2 log ?, AIC ve BIC değerlendirme kriterlerinden, madde model uyumunun kestirilmesinde ?2 istatistiğinden faydalanılmıştır. Eksiksiz veri setlerinden elde edilen değerler, kayıp veri baş etme yöntemleriyle tamamlanan veri setlerinden elde edilen kestirimler için referans olarak kullanılmıştır. İncelemeler sonucunda, beklenti maksimizasyon algoritması yönteminin rastgele kayıp mekanizmasında iyi, tamamen rastgele kayıp mekanizmasında kısmen iyi performans sergilediği sonucuna ulaşılmıştır. Regresyonla atama yönteminin de belirli koşullar altında iyi performans sergilediği ancak liste bazında silme yönteminin performansının düşük olduğu sonucuna ulaşılmıştır. Tüm kayıp veri mekanizmalarında kayıp veri oranı arttıkça, kayıp veri baş etme yöntemlerinin performansı da düşmektedir. Tüm mekanizmalarda ve koşullarda kullanılabilecek, en iyi sonuçları veren tek bir yöntemin varlığından söz etmenin mümkün olmadığı belirlenmiştir. The purpose of this study was to examine the effects of missing data handling techniques on model data fit and item model fit in the one parameter logistic Item Response Theory Model. For this purpose, data sets with sample sizes of 500, 1000, and 1500 and with 20 items that fit to one parameter logistic model were generated. Item difficulty values of the items in the generated data sets ranged from -2 to +2 and item discrimination was fixed as 1.5. The generated complete data sets were exposed to deletion at %5, %10, and %15 under missing at complete random (MCR) and missing at random (MR) conditions. Missing at complete random mechanism was obtained as a result of random values deleted among the total number of cells in the data set. A particular percentage of random units (individuals) were deleted for listwise deletion method. Missing at random mechanism was reached as a result of random deletion of cells pursuant to defining a three level variable in the data set at the following percentages: 20% at Level 1, 30% at Level 2 and 50% at Level 3. The generated missing data were resolved using listwise deletion method (LM), regression imputation, and expectation maximization algorithm (EMA). –2 log?, AIC, and BIC evaluation criteria were used for model data fit estimation and ?2 statistics were used for item model fit estimation. Values obtained from the complete data sets were taken as reference for predictions in the data sets that were completed with the effect of missing data handling techniques. As a result of the examinations, it was concluded that expectation maximization algorithm had good performance in missing at random mechanism but partially good in missing at complete random mechanism. It was also seen that regression imputation had good performance under certain conditions but the performance of listwise deletion method was poor. In all missing data mechanisms, the performance of the effect of missing data handling techniques declines as missing data increase. It is certain that a single method to give best results in all mechanisms and under any conditions is unlikely to be assumed.
Source
Eğitimde ve Psikolojide Ölçme ve Değerlendirme DergisiVolume
8Issue
2URI
https://doi.org/10.21031/epod.303753https://app.trdizin.gov.tr/makale/TWprd016ZzBOQT09
https://hdl.handle.net/20.500.12868/815