Thursday, February 5, 2009

Normality Test

Tulisan ini diambil dari skripsi mahasiswa Universitas Brawijaya Malang, Ratna Imanira Sofiani, dengan judul Perbandingan Beberapa Uji Kenormalan Sebaran Data, tentunya dalam artikel ini mengalami sedikit penambahan dan perubahan.

Analisis yang memerlukan adanya pendugaan terhadap parameter populasi yang diamati disebut analisis parametric. Dalam pendugaan parameter umumnya menggunakan statistic uji F, t, z dan khi-kuadrat. Statistic uji tersebut diturunkan dari sebaran normal, sehingga sebelum melakukan analisis uji parametric diperlukan asumsi kenormalan data, karena analisis ini menghendaki data yang menyebar normal. Tidak terpenuhi asumsi ini akan berpengaruh terhadap resiko salah dalam penarikan kesimpulan, sehingga akan menghasilkan kesimpulan yang kurang dapat dipercaya atau menyimpang dari keadaan yang sebenarnya, (Solimun, 1998).

Uji kenormalan diantaranya adalah Anderson Darling, Ryan Joiner, Kolmogorov Smirnof, Saphiro Wilk. Hipotesis untuk ketiga uji tersebut adalah
H0: Data menyebar normal
H1: Data tidak menyebar normal

Peubah (variable) yang dapat diuji oleh ketiga uji kenormalan ini adalah peubah kontinyu. Pada tiap-tiap uji kenormalan tersebut juga dihitung p-value sebagai nilai kritis eksak untuk menolak H0 yang pada hakekatnya benar. P-value dihitung berdasarkan peluang eksak yang berlandaskan pada uji statistic yang digunakan dalam pengujian tersebut, sehingga dalam berbagai pengujian p-value lebih sering digunakan untuk mengambil keputusan. Menurut Walpole & Myers, pendekatan p-value telah digunakan secara luas dalam statistics terapan karena dapat diketahui besarnya resiko salah secara eksak dalam pengambilan keputusan. Jika p-value < α, maka tolak H0 dengan resiko salah sebesar p-value tersebut. Semakin kecil p-value, maka semakin kecil peluang untuk membuat kesalahan dengan menolak H0. Kelemahan menggunakan table statistic (stat uji > nilai kritis/nilai table maka tolak Ho dan sebaliknya) adalah tidak bisa memberikan resiko salah secara eksak, misal: p-value 0.017 dan α = 0.05 maka resiko salah dalam penarikan kesimpulan adalah 5% padahal yang sebenarnya secara eksak adalah 1.7%.

Dengan berkembangnya komputer, perhitungan p-value untuk beberapa stat uji dapat dengan mudah dan cepat dilakukan. Berdasarkan taraf uji eksak yang merujuk pada p-value, maka kesimpulan penelitian berbunyi: bermakna dengan resiko salah sebesar p-value x 100%. Jika p-value kecil, maka hal itu menunjukkan konsistensi atau derajat yang relative kecil antara data dan H0 dan relative lebih besar dengan H1. Oleh karena itu semakin kecil p-value dibanding α tertentu, maka peluang resiko salah untuk menolak H0 secara eksak juga akan semakin kecil. Besar p-value tergantung dari kekritisan penellitian dan kepentingan penggunaan hasil penelitian. Kesimpulan yang ditarik berdasarkan uji statistic tidak pernah bersifat mutlak (dogmatis).

Transformasi data
(Gazpers, 1991), Kegunaan transformasi data:
1. Transformasi kadang-kadang mampu membuat data yang tidak normal menjadi mendekati normal.
2. Keragaman data transformasi tidak akan dipengaruhi oleh perubahan dalam nilai tengah perlakuan sebagai akibat perubahan skala.
3. Transformasi mampu membuat pengaruh nyata dari data yang bersifat multiplikatif menjadi model linear aditif.

Transformasi mengubah skala pengukuran asal ke dalam skala pengukuran yang baru sesuai dengan hasil yang digunakan, sehingga membuat analisis lebih shahih. Jenis-jenis transformasi antara lain adalah:
1. Transformasi logaritma (log Y), digunakan untuk data yang mempunyai simpangan baku proporsional (sebanding) terhadap nilai tengah atau ragam proporsional terhadap kuadrat nilai tengah perlakuan, maka transformasi ini akan menyamakan ragamnya. Selain itu digunakan pula apabila model perlakuan bersifat multiplikatif, sehingga pada skala log skala pengukurannya menjadi aditif. Transformasi log tidak dapat digunakan pada nilai nol. Oleh karena itu bila terdapat nilai pengamatan < 10, maka ditambahkan dulu dengan 1 maka transforamsi menjadi log (Y+1), sering digunakan untuk pengamatan yang menyatakan jumlah.
2. Transformasi akar kuadrat, digunakan pada data yang mengandung semua nilai kecil & data tersebut menurut sebaran poisson, yang mempunyai nilai tengah & ragam yang sama, digunakan juga untuk data presentase antara 0-30 atau 70-100, namun tidak diwilayah 30 – 70. Untuk wilayah 70 – 100%, sebaiknya data dikurangkan 100. Transformasi ini bermanfaat untuk presentase dalam kisaran tersebut meskipun skala pengukuran yang kontinyu, karenanilai tengah dan ragamnya cenderungsama. Bila pengamatan kecil, √Y cenderung berlebihan, sehingga nilai yang ditransformasikan menghasilkan nilai tengah yang kecil. Disarankan menggunana transformasi √ (Y+1/2), karena dengan kisaran lebih besar.
3. Transaformasi arcsin, digunakan bila data tersebar menurut sebaran binomial yang dinyatakan sebagai pecahan desimal atau % dan lebih disarankan bila persentase mencakup kisaran yang luas 0 – 100 %. Disarankan juga untuk sebaran besar nilai pengamatan 0 – 30 % & 70 – 100 %. Digunakan bila varians berkorelasi dengan mean (rata-rata) dan hampir 50 % data mengelompok disekitar nilai tengah dan makin jauh dari nilai tengah sehingga makin sedikit hasil pengamatan dengan penyimpangan yang besar. Oleh karena iru ragam hasil transformasi relatif konstan, yaitu sebesar 821/n bila transformasi dalam derajat dan sebesar 1/(4n) = 0.25/n bila dalam radian. Transformasi ini juga digunakan apabila varians berkorelasi dengan mean dan hampir 50% dari data mengelompok disekitar nilai tengah dan makin jauh dari nilai tengah sehingga makin sedikit hasil pengamatan dengan penyimpangan besar.
Hukum transformasi data proporsi berdasarkan Gomez and Gomez.
1. Data presentase yang mempunyai kisaran 30 – 70 % dianggap menyebar normal dan tidak perlu di transformasi.
2. Data 0 – 30 %dan 70 – 100% tidak normal sehingga perlu ditransformasi akar kuadrat.
3. Data yang tidak termasuk no.1 dan no. 2 adalah data yang tidak normal, harus ditransformasi arc sin.
4. Dalam arc sin nilai 0 diubah menjadi 1/n dan 100 menjadi 100 – 1/4n, dimana n adalah ukuran contoh.

No comments: