Lompat ke konten Lompat ke sidebar Lompat ke footer

Pengertian Data Outlier


– Outlier yakni kasus atau data yang memiliki karakterisitik unik yang terlihat sangat berbeda jauh dari observasi-observasi lainnya dan muncul dalam bentuk nilai ekstrim baik untuk sebuah variabel tunggal ataau variabel kombinasi.

Ada empat penyebab timbulnya data outlier, yaitu:
1.      Kesalahan dalam meng-entri data
2.      Gagal menspesifikasi adanya missing value dalam kegiatan komputer
3.      Outlier bukan merupakan anggota populasi yang kita ambil sebagai sampel
4.    Outlier berasal dari populasi yang kita ambil sebagai sampel, tetapi distribusi dan variabel dalam populasi tersebut memiliki nilai ekstrim dan tidak terdistribusi secara normal
Deteksi terhadap univariate outlier dapat dilakukan dengan menentukan nilai batas yang akan dikategorikan sebagai data outlier yaitu dengan caara mengkonversi nilai data ke dalam skor standardized atau yang biasa disebut z-score, yang memiliki nilai rata-rata (means) sama dengan nol dan standar deviasi sama dengan  satu. Data yang akan kita deteksi outliernya yakni data yang sudah kita screening normalitasnya.

Sumber artikel ini dari buku Aplikasi Analisis Multivariate dengan Program IBM SPSS 19, Prof. Dr. H. Imam Ghozali, M.Com, Akt, Badan Penerbit Universitas Diponegoro. Terimakasih.