Wednesday, February 18, 2009

Outlier – Pencilan

Dalam proses collecting data, researcher sering menemukan nilai pengamatan yang bervariasi (beragam). Keberagaman data ini, di satu sisi sangat dibutuhkan dalam analisa statistika, namun di sisi yang lain keberagaman data menyebabkan adanya nilai pengamatan yang berbeda dengan nilai pengamatan lainnya. Dengan kata lain terdapat beberapa data yang berbeda dengan pola keseluruhan data. Penyebabnya mungkin terdapat kesalahan pada pengamatan, pencatatan, maupun kesalahan yang lain. Data yang berbeda ini disebut sebagai outlier atau data pencilan.

Beberapa definisi outlier:
1. Dari www.infoskripsi.com menyatakan bahwa outliers (pencilan data) adalah data observasi yang muncul dengan nilai-nilai ekstrim baik secara univariat maupun multivariat.
2. Outliers adalah data yang muncul memiliki karakteristik unik yang terlihat sangat jauh berbeda dari observasi-observasi lainnya dan muncul dalam bentuk nilai ekstrim baik untuk sebuah variabel tunggal atau variabel kombinasi, (Hair, dkk, 1995).
3. Outlier adalah suatu data yang menyimpang dari sekumpulan data yang lain, (Ferguson, 1961).
4. Outlier adalah pengamatan yang tidak mengikuti sebagian besar pola dan terletak jauh dari pusat data, (Barnett, 1981)
5. Outlier adalah pengamatan yang jauh dari pusat data yang mungkin berpengaruh besar terhadap koefesien regresi, (R.K. Sembiring, 1950)
6. Multi outlier adalah outlier yang muncul di dalam range ketika dikombinasikan dengan variabel lain.

Menurut www.infoskripsi.com, outlier tersebut muncul karena berbagai kemungkinan:
1. Kesalahan prosedur dalam memasukkan data atau mengkoding
2. Karena keadaan yang benar-benar khusus, seperti pandangan responden terhadap sesuatu yang menyimpang
3. Karena ada sesuatu alasan yang tidak diketahui penyebabnya oleh peneliti,
4. Muncul dalam range nilai yang ada, tetapi bila dikombinasi dengan variabel lain menjadi ekstrim (disebut multivariat outliers).

Pendeteksian outlier
1. Solimun, 2002, mengatakan bahwa outliers dapat dilakukan dengan diagram kotak garis (box plot), bilamana terdapat titik di luar batas pagar (dalam output software komputer) umumnya dilambangkan dengan * mengindikasikan terdapat data pencilan (outliers). Cara lainnya adalah dengan melihat mean dan standard deviationnya (untuk data interval dan ratio) yaitu bilamana standard deviation > mean berarti terdapat data ouliers.
2. Menurut www.infoskripsi.com, pengujian univariat outlier dapat dilakukan dengan menentukan nilai ambang batas yang akan dijadikan outlier dengan cara mengkonversi nilai data penelitian ke dalam standard score atau Z-Score (Ferdinand, 2002). Nilai terstandar memiliki rata-rata (Mean) nol dengan standar deviasi (SD) sebesar satu. Batas nilai z-score menurut Hair dkk (1998) berada pada rentang 3-4.
3. Pemeriksaan terhadap multi outlier dapat dilakukan dengan uji jarak Mahalanobis pada tingkat p <> (Solimun, 2004). Jarak Mahalanobis dievaluasi dengan menggunakan χ² pada derajat kebebasan (df) sejumlah variabel yang digunakan dalam penelitian (Ferdinand, 2002). Data tidak memiliki multi outlier apabila Mahalanobis Distance tidak lebih besar dari χ².

Pengaruh outlier
Outlier berpengaruh terhadap proses analisa data, salah satunya terhadap nilai mean dan standard deviasi. Oleh karena itu, dalam suatu pola data keberadaan outlier harus dihindari. Outlier dapat menyebabkan variance data menjadi besar, interval data dan range menjadi lebar, mean tidak dapat menunjukkan nilai yang sebenarnya (bias), dan pada beberapa analisa inferensia outlier dapat menyebabkan kesalahan dalam pengambilan keputusan dan kesimpulan.

Dalam www.infoskripsi.com, outliers dapat dievaluasi dengan dua cara, yaitu:
1. Univariate outliers,
deteksi terhadap adanya outlier univariat dapat dilakukan dengan menentukan nilai ambang batas yang akan dikategorikan sebagai outliers dengan cara mengkonversi nilai data penilaian kedalam standard score atau yang biasa disebut z-score, yang mempunyai rata-rata nol dengan standar deviasi sebesar satu. Bila nilai-nilai itu telah dinyatakan dalam format yang standar (z-score), maka perbandingan antar besaran nilai dengan mudah dapat dilakukan. Untuk sampel besar (di atas 80 observasi), pedoman evaluasi adalah nilai ambang batas dari z-score ini berada pada rentang 3 sampai dengan 4 (Hair, dkk, 1995). Oleh karena itu kasus-kasus atau observasi-observasi yang mempunyai z-score > 3,0 akan dikategorikan outliers.
2. Multivariate outliers,
evaluasi terhadap multivariate outliers perlu dilakukan sebab walaupun data yang dianalisis menunjukkan tidak ada outliers bila sudah saling dikombinasikan. Jarak Mahalanobis (the Mahalanobis Distance) untuk tiap-tiap observasi dapat dihitung dan akan menunjukkan jarak sebuah observasi dari rata-rata semua variabel dalam sebuah ruang multidimensional (Hair, dkk, 1995). Uji terhadap outliers multivariate dilakukan dengan menggunakan kriteria jarak Mahalanobis pada tingkat p kurang dari 0.001. Jarak Mahalanobis ini dievaluasikan dengan menggunakan χ² pada derajat bebas sebesar jumlah variabel yang digunakan dalam penelitian ini.

Tuesday, February 17, 2009

Variance dan standard deviation

Melanjutkan pembahasan sebelumnya mengenai ukuran penyebaran, artikel ini membahas mengenai variance dan standard deviation. Variance berhubungan erat dengan standard deviation, yaitu digunakan untuk mengukur dan mengetahui seberapa jauh bagaimana penyebaran data dalam distribusi data. Dengan kata lain digunakan untuk mengukur variabilitas data, dalam bahasa awam variance adalah untuk mengetahui tingkat keragaman dalam data. Semakin tinggi nilai variance berarti semakin bervariasi dan beragam suatu data. Untuk menghitung variance, harus diketahui terlebih dahulu mean-nya, kemudian menjumlahkan kuadrat selisih dari tiap-tiap data terhadap mean tersebut. Secara numeric, variance merupakan rata-rata dari kuadrat selisih data terhadap mean.

Standard deviation diperoleh dari akar dari variance dan digunakan untuk mengukur penyebaran data. Standard deviation dan mean (rata-rata) lebih sering digunakan untuk mengetahui pola sebaran data, seperti contoh pola sebaran normal. Dalam sebaran normal, 68% data berarti mean +/- 1 * standard deviation, dan 95% data berarti mean +/- 2 * standard deviation. Di sini standard deviation memiliki arti yang sama dengan standard error mean.

Standard deviation merupakan salah satu dari beberapa ukuran penyebaran dalam statistika. Untuk menghitung standard deviation dari populasi perlu diketahui terlebih dahulu variance dari populasi tersebut. Hal ini karena standard deviation adalah akar kuadrat dari variance. Tidak seperti variance yang tidak mudah digunakan mengetaui tingkat variabilitas, standard deviation digunakan dengan mudah untuk mengetahui penyebaran.

Misal ada data tinggi badan siswa (cm) dalam satu kelas seperti berikut ini:
151.65 152.46 152.63 152.91 154.22 155.83 156.06 156.14 156.44
156.67 157.14 157.60 157.74 158.07 158.82 158.98 159.94 161.34
161.67 161.79 162.68 162.71 164.83 165.58 165.65 167.70 168.07
168.45 169.01 179.68
Dari data tersebut diketahui bahwa mean-nya adalah 160.42 dan standar deviation adalah 6.24. Melalui mean dan standard deviation dapat diketahui bahwa terdapat beberapa data yang berada di luar “standard”, “standard” dapat diketahui dari mean +/- standard deviation, yaitu 154.18 dan 166.66.

Seperti yang telah diketahui bahwa variance dan standard deviation memiliki hubungan secara matematis, yaitu variance merupakan kuadrat dari standard deviation. Mengapa menggunakan kuadrat ? Pengkuadratan pada tiap-tiap selisih membuat nilai selisih tersebut menjadi positif (nilai negative dapat mengurangi nilai pada variance). Pengkuadratan ini juga menyebabkan nilai yang besar pada variance, contoh 100^2 = 10.000 lebih besar daripada 50^2=2.500. Oleh karena itu secara praktek yang paling mudah digunakan adalah standard deviation.

Thursday, February 5, 2009

Normality Test

Tulisan ini diambil dari skripsi mahasiswa Universitas Brawijaya Malang, Ratna Imanira Sofiani, dengan judul Perbandingan Beberapa Uji Kenormalan Sebaran Data, tentunya dalam artikel ini mengalami sedikit penambahan dan perubahan.

Analisis yang memerlukan adanya pendugaan terhadap parameter populasi yang diamati disebut analisis parametric. Dalam pendugaan parameter umumnya menggunakan statistic uji F, t, z dan khi-kuadrat. Statistic uji tersebut diturunkan dari sebaran normal, sehingga sebelum melakukan analisis uji parametric diperlukan asumsi kenormalan data, karena analisis ini menghendaki data yang menyebar normal. Tidak terpenuhi asumsi ini akan berpengaruh terhadap resiko salah dalam penarikan kesimpulan, sehingga akan menghasilkan kesimpulan yang kurang dapat dipercaya atau menyimpang dari keadaan yang sebenarnya, (Solimun, 1998).

Uji kenormalan diantaranya adalah Anderson Darling, Ryan Joiner, Kolmogorov Smirnof, Saphiro Wilk. Hipotesis untuk ketiga uji tersebut adalah
H0: Data menyebar normal
H1: Data tidak menyebar normal

Peubah (variable) yang dapat diuji oleh ketiga uji kenormalan ini adalah peubah kontinyu. Pada tiap-tiap uji kenormalan tersebut juga dihitung p-value sebagai nilai kritis eksak untuk menolak H0 yang pada hakekatnya benar. P-value dihitung berdasarkan peluang eksak yang berlandaskan pada uji statistic yang digunakan dalam pengujian tersebut, sehingga dalam berbagai pengujian p-value lebih sering digunakan untuk mengambil keputusan. Menurut Walpole & Myers, pendekatan p-value telah digunakan secara luas dalam statistics terapan karena dapat diketahui besarnya resiko salah secara eksak dalam pengambilan keputusan. Jika p-value < α, maka tolak H0 dengan resiko salah sebesar p-value tersebut. Semakin kecil p-value, maka semakin kecil peluang untuk membuat kesalahan dengan menolak H0. Kelemahan menggunakan table statistic (stat uji > nilai kritis/nilai table maka tolak Ho dan sebaliknya) adalah tidak bisa memberikan resiko salah secara eksak, misal: p-value 0.017 dan α = 0.05 maka resiko salah dalam penarikan kesimpulan adalah 5% padahal yang sebenarnya secara eksak adalah 1.7%.

Dengan berkembangnya komputer, perhitungan p-value untuk beberapa stat uji dapat dengan mudah dan cepat dilakukan. Berdasarkan taraf uji eksak yang merujuk pada p-value, maka kesimpulan penelitian berbunyi: bermakna dengan resiko salah sebesar p-value x 100%. Jika p-value kecil, maka hal itu menunjukkan konsistensi atau derajat yang relative kecil antara data dan H0 dan relative lebih besar dengan H1. Oleh karena itu semakin kecil p-value dibanding α tertentu, maka peluang resiko salah untuk menolak H0 secara eksak juga akan semakin kecil. Besar p-value tergantung dari kekritisan penellitian dan kepentingan penggunaan hasil penelitian. Kesimpulan yang ditarik berdasarkan uji statistic tidak pernah bersifat mutlak (dogmatis).

Transformasi data
(Gazpers, 1991), Kegunaan transformasi data:
1. Transformasi kadang-kadang mampu membuat data yang tidak normal menjadi mendekati normal.
2. Keragaman data transformasi tidak akan dipengaruhi oleh perubahan dalam nilai tengah perlakuan sebagai akibat perubahan skala.
3. Transformasi mampu membuat pengaruh nyata dari data yang bersifat multiplikatif menjadi model linear aditif.

Transformasi mengubah skala pengukuran asal ke dalam skala pengukuran yang baru sesuai dengan hasil yang digunakan, sehingga membuat analisis lebih shahih. Jenis-jenis transformasi antara lain adalah:
1. Transformasi logaritma (log Y), digunakan untuk data yang mempunyai simpangan baku proporsional (sebanding) terhadap nilai tengah atau ragam proporsional terhadap kuadrat nilai tengah perlakuan, maka transformasi ini akan menyamakan ragamnya. Selain itu digunakan pula apabila model perlakuan bersifat multiplikatif, sehingga pada skala log skala pengukurannya menjadi aditif. Transformasi log tidak dapat digunakan pada nilai nol. Oleh karena itu bila terdapat nilai pengamatan < 10, maka ditambahkan dulu dengan 1 maka transforamsi menjadi log (Y+1), sering digunakan untuk pengamatan yang menyatakan jumlah.
2. Transformasi akar kuadrat, digunakan pada data yang mengandung semua nilai kecil & data tersebut menurut sebaran poisson, yang mempunyai nilai tengah & ragam yang sama, digunakan juga untuk data presentase antara 0-30 atau 70-100, namun tidak diwilayah 30 – 70. Untuk wilayah 70 – 100%, sebaiknya data dikurangkan 100. Transformasi ini bermanfaat untuk presentase dalam kisaran tersebut meskipun skala pengukuran yang kontinyu, karenanilai tengah dan ragamnya cenderungsama. Bila pengamatan kecil, √Y cenderung berlebihan, sehingga nilai yang ditransformasikan menghasilkan nilai tengah yang kecil. Disarankan menggunana transformasi √ (Y+1/2), karena dengan kisaran lebih besar.
3. Transaformasi arcsin, digunakan bila data tersebar menurut sebaran binomial yang dinyatakan sebagai pecahan desimal atau % dan lebih disarankan bila persentase mencakup kisaran yang luas 0 – 100 %. Disarankan juga untuk sebaran besar nilai pengamatan 0 – 30 % & 70 – 100 %. Digunakan bila varians berkorelasi dengan mean (rata-rata) dan hampir 50 % data mengelompok disekitar nilai tengah dan makin jauh dari nilai tengah sehingga makin sedikit hasil pengamatan dengan penyimpangan yang besar. Oleh karena iru ragam hasil transformasi relatif konstan, yaitu sebesar 821/n bila transformasi dalam derajat dan sebesar 1/(4n) = 0.25/n bila dalam radian. Transformasi ini juga digunakan apabila varians berkorelasi dengan mean dan hampir 50% dari data mengelompok disekitar nilai tengah dan makin jauh dari nilai tengah sehingga makin sedikit hasil pengamatan dengan penyimpangan besar.
Hukum transformasi data proporsi berdasarkan Gomez and Gomez.
1. Data presentase yang mempunyai kisaran 30 – 70 % dianggap menyebar normal dan tidak perlu di transformasi.
2. Data 0 – 30 %dan 70 – 100% tidak normal sehingga perlu ditransformasi akar kuadrat.
3. Data yang tidak termasuk no.1 dan no. 2 adalah data yang tidak normal, harus ditransformasi arc sin.
4. Dalam arc sin nilai 0 diubah menjadi 1/n dan 100 menjadi 100 – 1/4n, dimana n adalah ukuran contoh.

Wednesday, February 4, 2009

Perhitungan Margin Error

Confidence level, sample design survey dan ukuran sample merupakan faktor yang menentukan margin error, oleh karena itu ukuran sample yang besar akan menghasilkan margin error yang kecil begitu pula sebaliknya. Dengan confidence interval dapat diketahui random sampling error, namun tidak dapat diketahui sumber error yang selain itu atau non-sampling error (sample design yang tidak sesuai, kesalahan pada qnaire, kecurangan pada interviewer dan masalah lain pada responden).

Dalam menghitung margin error, faktor-faktor yang mempengaruhi adalah:
1. Ukuran sample
2. Pentingnya permasalahan dalam sample
3. Statistic atau penduga itu sendiri

Semakin besar sample akan semakin mewakili populasi. Namun kita tahu dalam pengambilan sample dan sample itu sendiri selalu terdapat bias. Untuk itu kita menggunakan margin error untuk mengurang bias yang terjadi. Bias yang dapat diketahui dari margin error adalah bias yang ditimbulkan dari sampling error.

Untuk mengetahui perhitungan margin error, terlebih dahulu harus diketahui mengenai standard error dari proporsi dan confidence interval. Confidence interval (CI) adalah prosentase yang menggambarkan seberapa dekat nilai asli dengan statistic (penduga) yang diukur +/- margin error. Standard error dari proporsi mengukur keakuratan penduga proporsi dan menduga standard deviasi dari prosentase. Dapat diduga dari p dan ukuran sample n, jika n cukup kecil maka menggunakan rumus:
Standard error = √p(1-p)/n

Untuk menduga proporsi plus dan minus, margin error merupakan confidence interval untuk proporsi atau prosentase. Dengan kata lain, margin error merupakan bagian dari confidence interval. Margin error dihitung dari mengkalikan standard error dengan faktor keyakinan (confidence factor) dari taraf keyakinan tertentu. Contoh:
-. Margin (plus – minus penduga) dari 1 standard error adalah 68% confidence interval,
-. Margin (plus – minus penduga) dari 1,96 standard error adalah 95% confidence interval
-. Margin (plus – minus penduga) dari 2.58 standard error adalah 99% confidence interval

Maximum margin error
Maximum margin error untuk proporsi adalah jarak dari confidence interval ketika p=50%. Untuk 95% confidence, rumusnya adalah
(maximum) margin error (95%) = 1.96 x √0.5(1-0.5)/n = 0.98/√n

Different confidence interval
Untuk margin error bergantung pada probability pada confidence interval, seperti berikut ini:
-. Margin error (99%) confidence = 1.29 / √n
-. Margin error (95%) confidence = 0.98 / √n
-. Margin error (90%) confidence = 0.82 / √n

Beberapa kesalahan masyarakat dalam memahami penggunaan margin error:
1. Tidak menggunakan atau tidak melibatkan confidence interval. Anda tidak akan tahu berapa margin error anda jika confidence interval tidak diketahui
2. Banyak orang percaya bahwa margin error mewakili keseluruhan dari error. Padahal hal ini tidak benar, yang tercakup dalam margin error adalah sampling error dan non sampling error tidak dapat dilihat dari margin error.
3. Masyarakat terkadang percaya bahwa margin error menunjukkan kualitas dari survey, artinya semakin kecil margin error maka semakin bagus kualitas survey, padahal hal ini tidak benar. Banyak faktor yang mempengaruhi kualitas survey, seperti metode yang digunakan, pengambilan sample, dll.

Margin of error

Margin of error adalah statistic yang menyatakan jumlah kesalahan dalam pengambilan contoh acak dalam suatu survey. Margin of error dapat didefinisikan juga sebagai jarak dalam confidence interval penduga (statistic) tertentu dari survey, jarak ini menggambarkan statistic. Margin of error mengukur seberapa dekat hasil dari sampel dengan hasil pada kenyataannya.

Istilah margin of error dalam prakteknya memiliki beberapa istilah lain, ada yang berpendapat margin of error sama dengan confidence interval. Selain itu, dalam American Association For Public Opinion Research, margin or error disebut juga sebagai Margin Of Sampling Error (MOSE). Sedangkan dalam harian Kompas, margin of error disebut dengan nir pencuplikan, dalam http:/researchexpert.wordpress.com/, margin of error disebut juga sebagai sampling error. Meskipun margin of error memiliki berbagai macam istilah, namun semua istilah tersebut memiliki kesamaan dan tulisan ini. Dalam tulisan ini istilah yang digunakan adalah margin error.

Margin error merupakan salah satu konsep dalam statistika yang sulit dipahami. Ide dasar dari margin error tidak sulit seperti yang dibayangkan. Dalam statistika, user selalu bekerja dengan data yang berdasarkan sample. Apabila sample tersebut representative mewakili populasi, maka informasi dari sample ini dapat digunakan untuk menjelaskan populasi.

Namun dalam prakteknya hal ini tidak selalu mudah. Kita tidak akan pernah mendapatkan sample yang representative atau mewakili, bahkan dalam faktanya, sangat sulit mendapatkan sample yang benar-benar mewakili. Untuk itu kita harus mengusahakan untuk mendapatkan sample yang baik, dan kita menggunakan teori peluang untuk menentukan sebarapa tingkat keyakinan kita terhadap populasi yang mewakili populasi. Seberapa baik sample mewakili populasi, dapat dilihat dari dua hal yaitu margin error dan confidence level. Kedua hal tersebut menceritakan bagaimana rasa semangkok sup dapat dirasakan dari satu sendok saja. Dari sinilah ide dasar dari margin error, bagaimana kita berpikir dengan benar untuk dalam memilih sample yang bagus yang benar-benar mewakili populasi.

Beberapa contoh margin error dan confidence interval:
1. Perusahaan X melakukan survey dan memperoleh hasil bahwa 50% responden mengatakan bahwa costumer service “sangat bagus”. Confidence level 95% plus minus 3%. Informasi ini berarti apabila survey dilakukan 100 kali maka prosentase yang mengatakan bahwa customer service “sangat bagus” terletak antara 47% dan 53% dalam 95 percobaan dari 100 kali percobaan.
2. Sebagai contoh dalam polling dengan margin error 3% pemilih X sebesar 47% padahal kenyataannya bisa lebih tingi yaitu 50% atau bahkan lebih rendah yaitu 44%. Dari sini dapat disimpulkan sementara bahwa prosentase yang benar lebih dekat ke 47%.

Margin error dapat diintepretaskan juga seperti confidence interval. Sebagai contoh, misalnya nilai yang diduga adalah 50 orang kemudian confidence intervalnya 5 orang, maka dapat dikatakan juga bahwa margin error adalah 5 orang. Selain diintepretasikan secara “absolute quantity”, margin error diintepretasikan secara “relative quantity”. Seperti contoh diatas, nilai yang diduga adalah 50 orang kemudian confidence intervalnya 5 orang, apabila kita menggunakan “absolute quantity” maka margin error adalah 5 orang. Namun apabila kita menggunakan “relative quantity” maka margin error adalah 10% (karena 5 orang adalah 10% dari 50 orang).

Sama seperti confidence interval, margin error berhubungan dengan confidence level, contoh confidence level 90%, 95% atau 99 %, namun yang sering digunakan adalah 95%.
Peluang ini (confidence level) menunjukkan tingkat margin error dalam nilai duga yang sebenarnya. Bersama dengan confidence level, desain sampel untuk survey dan termasuk di dalamnya ukuran contoh, menentukan tingkat margin error. Semakin besar ukuran contoh (sample) maka semakin kecil margin error, dan begitu pula sebaliknya.

Hubungan antara sample dengan margin error, dapat dilihat dalam tabel di bawah ini:
Survey Sample Size ------ Margin of Error Percent*
2,000 ------------------------------> 2
1,500 ------------------------------> 3
1,000 ------------------------------> 3
900 --------------------------------> 3
800 --------------------------------> 3
700 --------------------------------> 4
600 --------------------------------> 4
500 --------------------------------> 4
400 --------------------------------> 5
300 --------------------------------> 6
200 --------------------------------> 7
100 --------------------------------> 10
50 ---------------------------------> 14
*Assumes a 95% level of confidence

Dalam American Association For Public Opinion Research, hubungan tersebut digambarkan dalam chart berikut ini:


Margin error hanya menghitung untuk kesalahan random sampling, dan tidak memperhatikan systematic error dari non response error (kesalahan yang terjadi pada saat survey, daya ingat responden, motivasi, komunikasi dan pengetahuan responden).

Tuesday, February 3, 2009

Standard Error

Istilah “standard error” dan “standard deviation” terkadang membingungkan. Namun sebenarnya ada hal pokok yang membedakan. Ilustrasinya sebagai berikut: Apabila kita ingin mengetahui variance populasi maka untuk menduganya digunakan variance sampel. Hal yang sama apabila melakukan pendugaan mean terhadap populasi maka kita menggunakan mean sample, selanjutnya dalam pendugaan tersebut kemungkinan nilai mean akan berbeda-beda untuk tiap sample. Perbedaan ini dapat menimbulkan variasi pada penduga mean. Variasi pada penduga itulah yang disebut sebagai standard error. Oleh karena dalam ilustrasi menggunakan penduga mean maka variasi penduga disebut sebagai standard error mean. Dari masalah ini dapat diambil kesimpulan bahwa standard deviation mengukur variasi pengamatan, sedangkan standard error mengukur variasi penduga atau statistics.

Ilustrasi lain yang membedakan “standard error” dan “standard deviation” adalah sebagai berikut:
Dalam suatu kelas berisi 40 murid melakukan ujian untuk mata pelajaran A.
-. Standard deviation score test adalah variasi nilai antara 40 murid tersebut yang melakukan ujian untuk mata pelajaran A.
-. Standard error score test adalah variasi nilai dari seorang murid bernama Ali yang melakukan ujian mata pelajaran A secara berulang-ulang (murid Ali melakukan ujian lebih dari satu kali).

Hal ini membuktikan bahwa memang pengertian standard deviation hampir sama dengan standard error, dan kebingungan dua istilah ini memang dapat dimaklumi.

Perhitungan standard error berbeda-beda tergantung pada penduganya, misal untuk mean menggunakan standard error mean (SE(mean)). Rumus SE(mean) adalah SE(mean) = Standar deviation/√(sample size), ini menunjukkan bahwa nilai SE(mean) bergantung pada standard deviation dan ukuran sample. Dari rumus tersebut dapat diketahui pula bahwa nilai standard error akan turun apabila ukuran sample diperbanyak dan variance atau standard deviation sample dikurangi. Oleh karena itu, standard error dapat digunakan untuk menentukan dan mengontrol ukuran sample, hal ini berbeda dengan standard deviation yang nilainya tidak dipengaruhi ukuran sample.

Standard error dapat menunjukkan bagaimana tingkat fluktuasi dari penduga atau statistic. Standard error juga dapat diintepretasikan seberapa akurat penduga dalam menduga parameter.

Standard error dapat diaplikasikan dalam dua hal:
1. Nilai penduga atau statistic yang dibagi dengan standard error penduga akan menunjukkan apakah statistic sama dengan nol, kemudian nilai tersebut dibandingkan dengan nilai distribusi t. Berdasarkan beberapa literatur, rasio dari nilai penduga atau statistic dengan standard error disebut dengan Wald Test, atau dalam beberapa aplikasi disebut dengan t-test.
2. Standard error sebagai bagian dari confidence interval. Untuk sample yang besar, 95% confidence interval diperoleh dari 1.96 x standard error penduga. Standard error yang digunakan untuk confidence interval adalah standard error mean (SE(mean)), dengan ketentuan sebagai berikut:
a. 90% CI -> mean +/- 1.64 SE(mean)
b. 95% CI -> mean +/- 1.96 SE(mean)
c. 99% CI -> mean +/- 2.58 SE(mean)
Contoh: Dalam sekumpulan cabe, diketahui mean untuk 64 cabe adalah 10 gram, standard deviasinya 2 gram. Standard error dari sampel tersebut, SE(mean) = 2/√64 = 0.25. 95% confidence interval dari mean adalah
95% CI = 10 +/- 1.96*0.25 = 10 +/- 0.49 = 9.51 hingga 10.49

Penggunaan lain dari standard error adalah tidak sebagai bagian dari penduga atau statistic tetapi bagian dari logaritma statistic. Sebagai contoh, model logistic regresion dihitung dari odds ratio data, tapi standard error bukan sebagai odds ratio melainkan sebagai log odds ratio. Dalam kondisi ini diperlukan perhitungan secara komputer untuk mendapatkan confidence interval dalam log scale dan ditransformasi kembali ke skala asli.

Standard error dapat diketahui dari nilai confidence interval dan selang interval, dengan rumus:
a. 90% -> standard error = interval /1.64
b. 95% -> standard error = interval /1.96
c. 99% -> standard error = interval /2.58
Contoh: Masih dalam sekumpulan cabe, kita ingin mengetahui berapa standard error dari cabe apabila kita ingin menduga 95% confidence interval dengan selang +/- 0.5 gram. Standar errorr diperoleh dari SE(mean) = 0.5/1.96 = 0.26

Standard error dapat juga digunakan untuk menentukan ukuran sample secara sederhana, dengan rumus: n = (standard deviasi/standard error)^2, atau kuadrat dari pembagian standard deviasi dibagi standard error. Contoh: Sama seperti contoh di atas, kita ingin mengetahui berapa ukuran sample dari cabe apabila kita ingin menduga 95% confidence interval dengan selang +/- 0.5 gram dengan standar error 0.26, standard deviasi 2. Ukuran contoh diperoleh dari n = (standard deviasi/standard error)^2 = (2/0.26)^2 = 7.69^2 = 59.1 = 60. Maka sample yang dibutuhkan sebanyak 60 cabe.