Thursday, December 18, 2008

Aplikasi ukuran pemusatan dan ukuran penyebaran

Standardized Value (skor baku), ukuran ini digunakan untuk mem”baku”kan atau menstandardkan pengukuran yang melibatkan variable dengan satuan yang berbeda. Skor baku untuk suatu pengamatan adalah jarak antara nilai pengamatan ke pusat data atau rata-rata dalam satuan simpangan baku (S). Skor baku ini mempunyai range yang lebih kecil dari data sebelumnya. Rumus skor baku:

Hubungan antara simpangan baku, nilai data, dan rata-rata adalah semakin kecil simpangan baku, maka makin dekat nilai-nilai data pada rata-rata. Sebaliknya semakin besar simpangan baku, semakin menjauh nilai-nilai data dari rata-ratanya.

Skor baku mengukur berapa simpangan baku sebuah pengamatan terletak di atas dan di bawah nilai tengahnya. Karena simpangan baku tidak pernah negative, nilai skor baku yang positif mengukur berapa simpangan baku letak suatu pengamatan di atas nilai tengahnya, sedangkan nilai yang negative mengukur berapa simpangan baku letak suatu pengamatan di bawah nilai tengahnya.

Skor baku dapat digunakan untuk melakukan pemeriksaan terhadap kesetangkupan data berdasarkan ketentuan berikut:
1. Selang (-1,1) akan mengandung sekitar 68.27 % data
2. Selang (-2,2) akan mengandung sekitar 95.45 % data
3. Selang (-3,3) akan mengandung sekitar (99,73%) data

Measurement of skewness, ukuran ini digunakan untuk mengetahui bentuk sebaran data. Suatu sebaran dikatakan setangkup atau simetrik bila sebaran tersebut mempunyai sisi kanan dan kiri yang sama besar atau dapat dikatakan bahwa sebaran tersebut mempunyai simetri lipat sepanjang suatu sumbu tegak yang kedua sisinya dapat saling menutupi atau mempunyai bentuk simetris. Dalam sebaran simetris, kedudukan mean, median dan modus berada pada satu utitik. Sebaran simetris ini disebut juga sebagai sebaran normal. Sebaran yang tidak setangkup atau simetris dikatakan menjulur.
Gambar sebaran simetris

Gambar sebaran menjulur positif (skewness to right)

Gambar sebaran menjulur negatif (skewness to left)

Sebaran menjulur positif (skewness to right) artinya dalam sebaran ini mean > median > modus, sedangkan sebaran menjulur negatif (skewness to left) artinya dalam sebaran ini mean <> Untuk mengukur kemenjuluran (measurement of skewness) digunakan koefisien kemunjuluran Pearson, skewness = (mean – modus)/s, dimana s adalah simpangan baku, atau skewness = 3(mean-median)/s, dimana s adalah simpangan baku.

Simpangan baku dapat digunakan untuk mengukur jarak relative setiap hasil pengamatan ke pusat data. Sehingga dapat diketahui dalam kisaran k (k-1, 2, 3) simpangan baku berapa dari titik pusat. Dalam sebaran normal atau sebaran yang setangkup dimana mean=median=modus, terdapat aturan empiris yang menyatakan bahwa:
-. 68.27 % dari hasil pengukuran akan terletak dalam jarak 1 simpangan baku dari pusat atau dalam selang mean+/- s
-. 95.45 % dari hasil pengukuran akan terletak dalam jarak 2 simpangan baku dari pusat atau dalam selang mean+/-2 s
-. 99.73 % dari hasil pengukuran atau hamper seluruh pengamatan akan terletak dalam jarak 3 simpangan baku dari pusat atau dalam selang mean+/- 3s

Wednesday, December 17, 2008

Truth, Damn Truth, and Statistics

Judul di atas merupakan judul salah satu jurnal statistika yang ditulis oleh Paul F. Velleman, Cornell University, dalam Journal of Statistics Education Volume 16, Number 2 (2008), dari www.amstat.org/publications/jse/v16n2/velleman.html.

Dalam abstraknya penulis menjelaskan bahwa kekeliruan di pikiran masyarakat umum bahwa statistics merupakan alat untuk berbohong dengan data atau statistics merupakan alat untuk memanipulasi sesuatu dengan data. Terutama apabila dihubungkan dengan pernyataan yang berkembang dalam masyarakat yaitu ”lies, damn lies, and statistics”.

Penulis menjelaskan bahwa hal ini terjadi salah satunya mungkin karena kesalahan pada proses pembelajaran, terutama pada saat menggunakan statistics sebagai alat pengambil kesimpulan (statistics judgement). Pengajar statistics harus menjelaskan bahwa dalam proses statistics judgement, murid atau mahasiswa harus bertanggung terhadap keputusan yang direkomendasikannya. Terutama pembelajaran mengenai etika-etika dalam mengambil keputusan secara statistics melalui data yang tersedia.

Pernyataan ”lies, damn lies, and statistics” merupakan kutipan yang paling favorit dalam semua disiplin ilmu. A Google books mencatat kata ”lies, damn lies, and statistics” terdapat dalam lebih dari 495 buku, dan search engine google menemukan kurang lebih 207.000 lokasi yang menggunakan kata-kata tersebut. Dari sample tersebut setidaknya menunjukkan bahwa statistics identik dengan ketidak-jujuran, manipulasi dan kebohongan.

Asal mula pernyataan “lies, damn lies, dan statistics” berasal dari seorang penulis yang bernama Mark Twain, yang berkata “I was deducing from the above that I have been slowing down steadily in these thirty-six years, but I perceive that my statistics have a defect: 3,000 words in the, spring of 1868, when I was working seven or eight or nine hours at a sitting, has little or no advantage over the sitting of today, covering half the time and producing half the output. Figures often beguile me, particularly when I have the arranging of them myself; in which case the remark attributed to Disraeli would often apply with justice and force: "There are three kinds of lies: lies, damn lies, and statistics." (1924 , p. 246)”.

Dalam pernyataan tersebut, Twain mencoba menggunakan statistics analysis yaitu rata-rata. Twain menghitung rata-rata ia menulis adalah 375 kata tiap jam, hitungan ini diperoleh dari 3000 kata dibagi 8 jam kerja. Artinya ia hanya menulis cukup sedikit tiap hari, bagi Twain hal ini sangat tidak masuk akal. Dari masalah ini Twain berpendapat bahwa statistics mempunyai kelemahan, selain itu karena dengan statistics mereka tidak tahu berapa lama ia bekerja dalam tiap hari, dan Twain juga mengatakan bahwa terdapat kesalahan dalam statistics. Twain berpendapat bahwa hal tersebut merupakan kebohongan, sehingga ia pun setuju dengan pernyataan Disraeli mengenai “lies, damn lies and statistics”.

Penulis berpendapat bahwa sebenarnya asal usul kata ”lies, damn lies, and statistics” sebenarnya tidak jelas. Ada dua kesimpulan mengenai hal ini yaitu Twain tidak mengatakan hal itu dan bahwa Twain salah dalam mengutip pernyataan tersebut dari Disraeli. Asal perkataan tersebut sebenarnya terjadi pada tahun 1895 di Saratoga Springs, seorang ekonom dan politikus British, Leonard Henry Courtney (1832 – 1918) mengatakan bahwa : “After all, facts are facts, and although we may quote one to another with a chuckle the words of the Wise Statesman, "Lies—damn lies—and statistics," still there are some easy figures the simplest must understand, and the astutest cannot wriggle out of.4 p. 25).”

Dari pernyataan itu sangat mungkin apabila Twain salah mengutip dan mengasumsikan “Wise Statesman” adalah Disraeli. Padahal Leonard Henry Courtney pada saat itu menjelaskan permasalahan statistics dengan cara menghibur melalui kutipan “Wise Statesman “. Menurut Leonard Henry Courtney, “Wise Statesman“ sebenarnya adalah Arthur Yakobus Balfour, orang yang berpengaruh dari partai conservative selama 50 tahun dan bukan Disraeli. Arthur Yakobus Balfour dalam pidato politiknya menyindir lawan politiknya yang menggunakan statistics untuk dalam memalsukan data.

Selanjutnya penulis menerangkan mengani makna “truth”, menurutnya seseorang yang menggunakan statistics untuk kebohongan dan orang yang memahami kutipan (lies, damn lies, and statistics) sebenarnya tidak yakin bahwa tujuan statistics adalah menyesatkan dan ketidak-jujuran. Mengenai “truth” atau kebenaran ini penulis menjabarkan beberapa axiomanya, salah satunya adalah tujuan dari statistics yaitu memfasilitasi penemuan, pemahaman, perhitungan, penemuan model, dan komunikasi fakta mengenai dunia. Berdasarkan axioma ini, berarti tidak mungkin statistics diposisikan sejajar dengan “lies and damn lies”. Dalam penerapan di kehidupan umum, statistics seperti sebagai ”gatekeeper”. Statistics secara significance dibutuhkan dalam ilmu sosial, sebagai contoh dalam ilmu kesehatan, statistics sebagai ”alat bukti”, yang untuk memilih treatment yang tepat secara ilmiah.

Penulis juga menjelaskan mengenai fakta dan proses statistics, statistics memiliki dua arti yaitu statistics berarti data yang dikumpulkan dan statistics berarti proses dan analysis terhadap fakta-fakta untuk mendapatkan arti yang lebih dari data kemudian dari data dapat didefinisikan dan dibuat kesimpulan dan keputusan.

Seakan tidak mau kalah dengan kutipan “damn lies”, penulis menerangkan bahwa statistics merupakan “damn truth”. John Tukey mengatakan bahwa statistics lebih “science” daripada mathematics. Mathematics secara theory dan dalil dapat dikatakan lebih benar, sedangkan untuk statistics harus perlu ilmu yang menyertai agar analisanya dikatakan benar. Misal suatu data statistics, tidak peduli bagaimana benarnya data tersebut, namun apabila cara memperolehnya tidak secara statitics, maka data tersebut tidak dapat digunakan lagi. Statistics lebih membahas masalah empirik daripada masalah teoritis. Statistician bekerja dengan data dan membentuk model dari data tersebut. Pada saat model dan data menyimpang, hal itu merupakan suatu kemajuan dan bukannya suatu kegagalan. Isaac Asimov mengatakan bahwa “The most exciting phrase to hear in science, the one that heralds new discoveries, is not 'Eureka!' but 'That's funny... ‘”

Darimana anggapan “damn lies” itu muncul ? Statistician secara jelas mempertimbangkan kejujuran dan mengakui ketidakpastian mereka. Namun ketika statistician melakukan kesalahan, hal ini dianggap statistician melakukan penipuan yang disengaja dan statistician dianggap gagal. Menurut penulis, ”lies” ini terjadi dari ketidakpastian yang terdapat dalam statistics. Ketidakpastian dalam statistics sebenarnya ”telah dibayar” dengan adanya interval dalam menduga nilai parameter. Tidak cukup dengan itu, statistics juga memberikan nilai pasti dari ketidakpastian interval tersebut. Secara ilmu, statistics bukanlah masalah algoritma atau deterministic (kepastian), masalah dalam statistics terjadi karena sample yang mungkin memberikan jawaban yang berbeda, dan bukan statistician yang bekerja pada sample yang sama memberikan jawaban berbeda.

Kemudian penulis juga menjelaskan mengenai ”statistician judgement”. Statistical analysis atau pengambilan keputusan berdasarkan statistics bukanlah hal yang baru dan termasuk di dalam area pengujian hipotesis. Namun banyak orang yang langsung menginginkan p-value kurang dari 0.05 tanpa mendasarkan pada pertimbangan keilmuan. Sangat mudah untuk menentukan proses hipotesis dalam statistics atau metode ilmiah, namun perlu pertimbangan yang kuat dalam memutuskannya.

Sir Ronald Fisher, penemu experimental design dan analysis of variance, berpendapat bahwa statistician terbiasa dengan p-value kurang dari 0.05 untuk diterima secara statistics, dan inilah juga yang menjadi pedoman bagi statistician hingga saat ini. Yang paling penting bagi pengambil keputusan yang memanfaatkan statistical analysis adalah pengambil keputusan harus memahami masalah yang dihadapi dan pengetahuan tentang ilmu mereka.

Yang dibutuhkan judgement dalam statistics adalah kejujuran. Untuk itu ketepatan dalam mengetahui masalah apa yang akan dibahas merupakan hal penting, terutama dalam proses statistics judgement. Seperti dalam buku William Hunter -"The Practice of Statistics: The Real World is an Idea Whose Time Has Come" mengatakan bahwa pertanyaan utama dari statistician dalam menganalisa sesuatu adalah apa tujuan dari penelitian ini. Dengan mengetahui permasalahan yang akan dianalisa, statistician dapat memperoleh petunjuk yang benar dalam menentukan statistics judgement. Selain itu dengan mengetahui permasalahan yang sebenarnya, kejujuran dalam statistical analysis juga dapat dipertanggungjawabkan. Statistician dalam proses analisanya merupakan proses yang mencari kebenaran dan bukan proses yang mencari-cari kebenaran.

Jika dilihat kembali ke atas, sebenarnya Twain tidak bermaksud mencaci maki statistics, namun lebih pada peringatan untuk masyarakat awam bahwa harus berhati-hati pada data dan output statistics, karena bila salah dalam menafsirkan dapat mengakibatkan kesalahan yang fatal dan menyesatkan. Pendapat Twain ini setidaknya memberikan masukan pada statistician agar dalam statistics judgement tetap diperlukan etika sehingga tidak seolah-olah dibohongi oleh statistics dan membohongi orang lain dengan statistics.(krisnafr)


(diringkas sesuai dengan jurnal asli dengan keterbatasan oleh Krisna Rahmantya)

Monday, December 15, 2008

Ukuran penyebaran

Disebut juga sebagai ukuran variasi atau dispersi, ukuran ini berasal dari pemikiran bahwa ada data yang berada “di sekitar” rata-rata. Ada data yang tepat sama dengan nilai rata-rata, ada yang lebih kecil dan ada juga yang nilainya lebih besar dari rata-rata. Artinya bahwa antara tiap-tiap data dengan rata-rata terdapat jarak atau dispersi, begitu pula dispersi juga terdapat antara data yang satu dengan yang lain. Ukuran variasi antara lain simpangan baku (standard deviation), koefisien variasi (coefficient of variation), jarak (range) dan rata-rata simpangan (mean deviation). Ukuran variasi diperlukan karena ukuran ini memberikan informasi mengenai sebaran nilai pada data tersebut. Selain itu ukuran ini dapat digunakan untuk membandingkan sebaran dari dua distribusi data.

Simpangan baku (standard deviation), ukuran variasi ini paling banyak digunakan karena mempunyai sifat mathematics yang berguna untuk teori dan analisis. Simpangan baku diperoleh dari akar dari ragam (variance). Variance adalah rata-rata dan kuadrat dari selisih tiap-tiap data dengan mean-nya. Simbol untuk variance adalah σ2 atau sigma kuadrat. Simpangan baku memiliki satuan yang sama seperti satuan data aslinya, sehingga kelemahannya apabila membandingkan dua atau lebih data yang berbeda satuan maka pembandingan akan sulit dilakukan.
Variance untuk populasi rumusnya:

Variance untuk sampel rumusnya:
atau
Untuk simpangan baku populasi rumusnya:

Simpangan baku untuk sampel rumusnya:
atau

Terdapat perbedaan pembagi pada populasi dan sampel, pada populasi pembagi adalah n sedangkan pada sampel pembagi adalah n-1. Perbedaan ini karena pada sampel hanya mengestimasi populasi, artinya nilai sampel hanya mendekati dan bukan nilai yang menggambarkan nilai sebenarnya pada populasi. Pembagi pada sampel (n-1) disebut dengan derajat bebas (degree of freedom). Dapat ditunjukan secara statistika matematis bahwa dengan pembagi (n-1), variance sampel merupakan “unbiased estimate” bagi variance populasi.

Nilai jarak (range), merupakan ukuran variasi yang paling sederhana dan mudah untuk dihitung. Data diurutkan dahulu dari yang terkecil hingga terbesar kemudian dihitung selisih antara data terbesar dan data terkecil.
Rumusnya; Nilai jarak = X(n) – X1. Range merupakan ukuran yang kasar untuk n besar dan ukuran ini kurang sensitive, artinya bahwa informasi bisa menyesatkan apabila ada dua data yang memiliki kisaran sama tapi simpangan baku yang berbeda. Range ini tidak selalu dapat menggambarkan keragaman data untuk n besar.

Rata-rata simpangan, seperti namanya perhitungan ini dilakukan dengan cara merata-ratakan simpangan data. Simpangan data adalah selisih tiap-tiap data dengan rata-ratanya. Rata-rata simpangan adalah rata-rata hitung dari nilai absolute dari simpangan, rumusnya:


Koefisien variasi , pengukuran ini bermula dari simpangan baku atau standard deviation yang mempunyai satuan yang sama dengan satuan data aslinya, hal ini merupakan kelemahan apabila kita ingin membandingkan dua atau lebih kelompok data yang satuannya berbeda.
Agar dapat membandingkan dua atau lebih kelompok data dengan satuan yang berbeda maka digunakan Koefisien Variasi (KV), yang bebas dari satuan data asli.
Koefisien variasi untuk populasi

Koefisien variasi untuk sampel

Jika ada dua kelompok data dengan KV1 dan KV2, di mana KV1 > KV2, maka kelompok data pertama lebih bervariasi atau lebih heterogen daripada kelompok data kedua. Koefisien Variasi (KV), dapat juga digunakan untuk menentukan apakah kelompok data tersebut memiliki konsistensi atau tidak. Semakin besar KV maka semakin tidak konsisten, begitu pula sebaliknya semakin kecil KV semakin konsisten.

Ukuran pemusatan 2

Selain mean, median, dan modus yang termasuk ukuran pemusatan adalah kuartil, desil dan persentil. Kuartil adalah nilai-nilai yang membagi pengamatan menjadi 4 bagian yang sama, tentunya setelah data diurutkan dari kecil ke besar maupun sebaliknya. Nilai itu dilambangkan dengan Q1, Q2, dan Q3. Yang termasuk dalam Q1 adalah seluruh data yang berada 25% dibawahnya, untuk Q2 adalah seluruh data yang berada 50% dibawahnya sedangkan Q3 seluruh data yang berada 75% dibawahnya. Nilai Q1 adalah data terakhir dari 25% data pertama dari seluruh data, untuk nilai Q2 adalah data terakhir dari 50% data pertama dari seluruh data dan nilai Q3 adalah data terakhir dari 75% data pertama dari seluruh data. Apabila dilihat dari penjelasan tersebut, diketahui bahwa Q2 sama dengan median. Aplikasi dari kuartil adalah dapat mendeteksi kesetangkupan melalui median dengan cara median = (Q1+Q3)/2.

Desil adalah nilai-nilai yang membagi pengamatan menjadi 10 bagian yang sama setelah data diurutkan. Nilai-nilai itu dilambangkan dengan D1, D2, hingga D9. Sama seperti kuartil, nilai D1 berarti data terakhir dari 10% data pertama dari seluruh data, begitu pula untuk nilai D2 hingga D9. Percentil adalah nilai-nilai yang membagi pengamatan menjadi 100 bagian yang sama setelah data diurutkan. Nilai-nilai itu dilambangkan dengan P1, P2, hingga P99. Nilai P1 berarti data terakhir dari 1% data pertama dari seluruh data, begitu pula untuk P1 hingga P99.

Hubungan antara kuartil dan persentil adalah:
-. Kuartil bawah atau Q1 adalah persentil ke-25.
-. Kuartil tengah atau Q2 adalah persentil ke-50.
-. Kuartil atas atau Q3 adalah persentil ke-75.

Friday, December 12, 2008

“Average” atau “mean”

Mean dalam statistics mempunyai dua arti yaitu arithmetic mean dan expected value (nilai harapan) dari variable. Dalam beberapa hal, mean disebut juga sebagai average. Namun tidak benar apabila mean hanya diartikan sebagai arithmetic mean, karena arithmetic mean berbeda dengan average type lainnya seperti “mean (geometric mean , harmonic mean,dll) ”, “median” dan “modus”. Dari pernyataan ini, dapat juga disimpulkan bahwa mean merupakan bagian average, disamping median dan modus. Sehingga average dapat juga disebut sebagai central tendency, atau pengukuran terhadap pusat data.

Dalam apilkasinya penggunaan kata “average” dan “mean” bergantung pada pemakainya, karena inti dari keduanya sama saja. Hanya saja menggunakan kata mean lebih jelas makna statisticsnya daripada average. Hal ini karena average, meskipun sering disamakan dengan mean, masih belum jelas apakah mean, median atau modus dan dalam keseharian masyarakatpun lebih faham kata-kata “average” daripada “mean” untuk mengartikan rata-rata.

Selain lebih statistics, mean atau mean score dapat diperluas penggunaanya dengan penambahan bobot (weighted) menjadi weighted mean score. Dalam weighted mean score, tiap data yang dihitung meannya masing-masing diberi bobot yang berbeda-beda. Sebenarnya hampir sama dengan mean score (arithmetic mean) atau average yang biasa dilakukan hanya saja jika mean score ini bobot untuk masing-masing data adalah sama yaitu satu, untuk weighted mean score nilai bobotnya berbeda-beda untuk tiap data. Sedangkan istilah average, sampai saat ini masih terbatas untuk arithmetic mean atau mean score(tanpa pembobotan), belum ada dan belum umum istilah weighted average.

Penggunaan istilah ini terserah pada pemakainya, yang terpenting adalah makna yang dimaksud adalah benar rata-rata, sebagai contoh: formula excel dalam mengartikan rata-rata menggunakan (=average) dan bukan (=mean).

Tuesday, December 9, 2008

Ukuran pemusatan

Yang termasuk dalam ukuran pemusatan adalah mean, median, modus, kuartil, desil, dan persentil.

Mean
Mean atau sering disebut rata-rata merupakan nilai yang mewakili seluruh data. Mean punya kecenderungan memusat. Jenis mean antara lain arithmetic mean, geometric mean, harmonic mean, namun yang paling sering digunakan adalah arithmetic mean (rata-rata hitung) atau selanjutnya disebut dengan mean, karena paling mudah digunakan dan diaplikasikan . Prinsip mean adalah menjumlahkan semua data kemudian dibagi banyaknya data. Kelebihan mean adalah nilai mean dapat menggambarkan atau mewakili seluruh data, karena semua data mendapatkan kesempatan dan proporsi yang sama dalam perhitungan atau semua data diperhitungkan dalam proses mendapatkan mean. Namun hal ini justru merupakan kelemahan mean, dengan semua data diperhitungkan artinya jika terdapat data yang nilainya lebih besar atau kecil daripada mayoritas data (data pencilan/outlier) maka nilai mean akan menjadi bias.

Mean dapat juga digunakan dalam data berkelompok. Data berkelompok merupakan data yang telah disempurnakan dalam table frekuensi. Mean dalam data berkelompok dan data tidak berkelompok mempunyai kelebihan masing-masing. Dalam aplikasinya data tidak berkelompok lebih sering digunakan, karena lebih mudah dan lebih menggambarkan data sesungguhnya, terutama bila digunakan untuk proses deskripsi data.Sedangkan dalam data berkelompok, perhitungan mean tidak peka terhadap nilai ekstrim (pencilan/outlier), sehingga seakan-akan kurang menggambarkan distribusi data sebenarnya.

Median
Median merupakan nilai pengamatan atau data yang terletak ditengah-tengah data jika data diurutkan dari terkecil ke terbesar atau sebaliknya. Median juga merupakan data yang di tengah apabila banyaknya data ganjil atau rata-rata kedua data yang di tengah banyaknya data genap. Apabila banyaknya data adalah genap maka median adalah antara pengamatan yang ke-(1/2 n) dan ke-(1/2 n+1), sedangkan untuk n yang ganjil, median adalah pengamatan yang ke-(1/2 n +1). Kelebihan median adalah median tidak dipengaruhi pencilan (outlier) dalam data, namun ini juga bisa menjadi kelemahan karena median tidak melihat data secara keseluruhan. Oleh karena sifat yang seperti ini, median lebih sering digunakan dalam penelitian kualitatif ketimbang penelitian kuantitatif. Untuk data berkelompok, median dihitung dengan rumus sebagai berikut:

Me = Bb + ((1/2*ft – fsm) / fm)*I, di mana:
Me = median
Bb = Batas kelas bawah di mana median terletak, yaitu pada frek. Kumulatif ke-1/2 n
ft =frekuensi total
fsm = frekuensi sebelum kelas yang mengandung median
fm = frekuensi pada kelas yang terdapat median
I = selang atau lebar kelas

Modus
Modus merupakan nilai data dengan frekuensi lebih banyak dari data yang lain. Diantara median dan mean, modus lebih jarang digunakan, karena kurang menggambarkan distribusi data sesungguhnya. Namun terdapat kelebihan dari modus yaitu penggunaanya mudah, modus tidak membutuhkan perhitungan khusus dan dapat digunakan dalam data kualitatif dan kuantitatif.

Hubungan antara mean, median dan modus adalah sebagai berikut:
Modus = 3 * median – 2 * mean
Selain untuk mengukur modus, pengukuran tersebut dapat digunakan untuk mengetahui kesimetrisan distribusi data. Semaikin kecil selisih antara median dan mean maka distribusi data akan semakin simetris dengan modus yang berada di tengah. Apabila distribusi mempunyai kurva yang simetris maka letak atau nilai mean, median dan modus adalah sama pada satu titik.

Bentuk sebaran data dapat diketahui melalui perbandingan mean dan median:
-. Apabila median <> data menjulur ke kanan (skewness to right)
-. Apabila median = rata-rata -> data setangkup
-. Apabila median > rata-rata -> data menjulur ke kiri (skewness to left)

Konsep Deskriptif

Dalam tulisan sebelumnya telah dijelaskan mengenai konsep dalam statistika, salah satu diantaranya adalah konsep deskriptif dan inferensial. Menurut Wallpole, 1995, konsep deskriptif atau yang lebih dikenal dengan statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian data sehingga memberikan informasi yang berguna.

Statistika deskriptif berfungsi meringkas informasi untuk membantu pengambilan keputusan dan meringkas data mentah sehingga didapatkan pola sebaran data dan menyajikan informasi di dalam data, selain itu untuk mendapatkan gambaran tentang bentuk sebaran data yang merupakan dasar pemilihan metode analisa yang tepat . Dalam statistika deskriptif tidak melibatkan peluang (probability) dalam penarikan kesimpulan atau keputusan sehingga penggunaanya sangat terbatas, oleh karena itu dalam proses penarikan kesimpulan statistika deskiptif ini kurang dapat dipertanggung jawabkan. Jadi secara teknis dapat diketahui bahwa dalam statistik deskriptif tidak ada uji signifikansi, tidak aa taraf kesalahan, karena peneliti tidak bermaksud membuat generalisasi, sehingga tidak ada kesalahan generalisasi. Penggunakan mean, median, modus, dan standard deviasi hanya menunjukkan pendugaan pada satu titik saja, tidak dapat diketahui berapa peluang kebenaran maupun kesalahannya dalam menduga suatu parameter populasi. Namun meskipun tidak melibatkan peluang, dalam beberapa kasus aplikasi tertentu penggunaan statistika deskriptif tetap digunakan dalam menentukan kesimpulan dan keputusan.

Pengukuran dalam statistika deskriptif ini terbagi menjadi dua yaitu ukuran pemusatan dan ukuran penyebaran. Ukuran pemusatan merupakan pengukuran terhadap penduga dengan melihat semua data terwakili oleh suatu nilai yang “seolah-olah terpusat” di tengah semua data. Termasuk dalam ukuran pemusatan adalah mean, median, modus, kuartil, desil, dan persentil.

Ukuran penyebaran merupakan penjelasan terhadap data mengenai sebaran, variasi, kehomogenan-keheterogenen dari data. Ukuran ini dapat juga digunakan untuk membandingkan sebaran dua atau lebih distribusi dari data tersebut, misal untuk membandingkan tingkat produktivitas dua atau lebih perusahaan. Yang termasuk ukuran penyebaran meliputi standard deviasi, range, koefisien variasi, standardized value, dan measure of skewness.

Kedudukan keduanya saling melengkapi informasi data, misal rata-rata produksi perusahaan A dan B adalah 100 box dan standar deviasinya masing-masing 20 dan 30. Bila hanya melihat dari mean-nya seakan-akan produksi kedua perusahaan tersebut sama namun apabila melihat dari standar deviasinya maka akan diperoleh informasi tambahan bahwa ternyata perusahaan A lebih homogen daripada perusahaan B.