Thursday, December 18, 2008

Aplikasi ukuran pemusatan dan ukuran penyebaran

Standardized Value (skor baku), ukuran ini digunakan untuk mem”baku”kan atau menstandardkan pengukuran yang melibatkan variable dengan satuan yang berbeda. Skor baku untuk suatu pengamatan adalah jarak antara nilai pengamatan ke pusat data atau rata-rata dalam satuan simpangan baku (S). Skor baku ini mempunyai range yang lebih kecil dari data sebelumnya. Rumus skor baku:

Hubungan antara simpangan baku, nilai data, dan rata-rata adalah semakin kecil simpangan baku, maka makin dekat nilai-nilai data pada rata-rata. Sebaliknya semakin besar simpangan baku, semakin menjauh nilai-nilai data dari rata-ratanya.

Skor baku mengukur berapa simpangan baku sebuah pengamatan terletak di atas dan di bawah nilai tengahnya. Karena simpangan baku tidak pernah negative, nilai skor baku yang positif mengukur berapa simpangan baku letak suatu pengamatan di atas nilai tengahnya, sedangkan nilai yang negative mengukur berapa simpangan baku letak suatu pengamatan di bawah nilai tengahnya.

Skor baku dapat digunakan untuk melakukan pemeriksaan terhadap kesetangkupan data berdasarkan ketentuan berikut:
1. Selang (-1,1) akan mengandung sekitar 68.27 % data
2. Selang (-2,2) akan mengandung sekitar 95.45 % data
3. Selang (-3,3) akan mengandung sekitar (99,73%) data

Measurement of skewness, ukuran ini digunakan untuk mengetahui bentuk sebaran data. Suatu sebaran dikatakan setangkup atau simetrik bila sebaran tersebut mempunyai sisi kanan dan kiri yang sama besar atau dapat dikatakan bahwa sebaran tersebut mempunyai simetri lipat sepanjang suatu sumbu tegak yang kedua sisinya dapat saling menutupi atau mempunyai bentuk simetris. Dalam sebaran simetris, kedudukan mean, median dan modus berada pada satu utitik. Sebaran simetris ini disebut juga sebagai sebaran normal. Sebaran yang tidak setangkup atau simetris dikatakan menjulur.
Gambar sebaran simetris

Gambar sebaran menjulur positif (skewness to right)

Gambar sebaran menjulur negatif (skewness to left)

Sebaran menjulur positif (skewness to right) artinya dalam sebaran ini mean > median > modus, sedangkan sebaran menjulur negatif (skewness to left) artinya dalam sebaran ini mean <> Untuk mengukur kemenjuluran (measurement of skewness) digunakan koefisien kemunjuluran Pearson, skewness = (mean – modus)/s, dimana s adalah simpangan baku, atau skewness = 3(mean-median)/s, dimana s adalah simpangan baku.

Simpangan baku dapat digunakan untuk mengukur jarak relative setiap hasil pengamatan ke pusat data. Sehingga dapat diketahui dalam kisaran k (k-1, 2, 3) simpangan baku berapa dari titik pusat. Dalam sebaran normal atau sebaran yang setangkup dimana mean=median=modus, terdapat aturan empiris yang menyatakan bahwa:
-. 68.27 % dari hasil pengukuran akan terletak dalam jarak 1 simpangan baku dari pusat atau dalam selang mean+/- s
-. 95.45 % dari hasil pengukuran akan terletak dalam jarak 2 simpangan baku dari pusat atau dalam selang mean+/-2 s
-. 99.73 % dari hasil pengukuran atau hamper seluruh pengamatan akan terletak dalam jarak 3 simpangan baku dari pusat atau dalam selang mean+/- 3s

Wednesday, December 17, 2008

Truth, Damn Truth, and Statistics

Judul di atas merupakan judul salah satu jurnal statistika yang ditulis oleh Paul F. Velleman, Cornell University, dalam Journal of Statistics Education Volume 16, Number 2 (2008), dari www.amstat.org/publications/jse/v16n2/velleman.html.

Dalam abstraknya penulis menjelaskan bahwa kekeliruan di pikiran masyarakat umum bahwa statistics merupakan alat untuk berbohong dengan data atau statistics merupakan alat untuk memanipulasi sesuatu dengan data. Terutama apabila dihubungkan dengan pernyataan yang berkembang dalam masyarakat yaitu ”lies, damn lies, and statistics”.

Penulis menjelaskan bahwa hal ini terjadi salah satunya mungkin karena kesalahan pada proses pembelajaran, terutama pada saat menggunakan statistics sebagai alat pengambil kesimpulan (statistics judgement). Pengajar statistics harus menjelaskan bahwa dalam proses statistics judgement, murid atau mahasiswa harus bertanggung terhadap keputusan yang direkomendasikannya. Terutama pembelajaran mengenai etika-etika dalam mengambil keputusan secara statistics melalui data yang tersedia.

Pernyataan ”lies, damn lies, and statistics” merupakan kutipan yang paling favorit dalam semua disiplin ilmu. A Google books mencatat kata ”lies, damn lies, and statistics” terdapat dalam lebih dari 495 buku, dan search engine google menemukan kurang lebih 207.000 lokasi yang menggunakan kata-kata tersebut. Dari sample tersebut setidaknya menunjukkan bahwa statistics identik dengan ketidak-jujuran, manipulasi dan kebohongan.

Asal mula pernyataan “lies, damn lies, dan statistics” berasal dari seorang penulis yang bernama Mark Twain, yang berkata “I was deducing from the above that I have been slowing down steadily in these thirty-six years, but I perceive that my statistics have a defect: 3,000 words in the, spring of 1868, when I was working seven or eight or nine hours at a sitting, has little or no advantage over the sitting of today, covering half the time and producing half the output. Figures often beguile me, particularly when I have the arranging of them myself; in which case the remark attributed to Disraeli would often apply with justice and force: "There are three kinds of lies: lies, damn lies, and statistics." (1924 , p. 246)”.

Dalam pernyataan tersebut, Twain mencoba menggunakan statistics analysis yaitu rata-rata. Twain menghitung rata-rata ia menulis adalah 375 kata tiap jam, hitungan ini diperoleh dari 3000 kata dibagi 8 jam kerja. Artinya ia hanya menulis cukup sedikit tiap hari, bagi Twain hal ini sangat tidak masuk akal. Dari masalah ini Twain berpendapat bahwa statistics mempunyai kelemahan, selain itu karena dengan statistics mereka tidak tahu berapa lama ia bekerja dalam tiap hari, dan Twain juga mengatakan bahwa terdapat kesalahan dalam statistics. Twain berpendapat bahwa hal tersebut merupakan kebohongan, sehingga ia pun setuju dengan pernyataan Disraeli mengenai “lies, damn lies and statistics”.

Penulis berpendapat bahwa sebenarnya asal usul kata ”lies, damn lies, and statistics” sebenarnya tidak jelas. Ada dua kesimpulan mengenai hal ini yaitu Twain tidak mengatakan hal itu dan bahwa Twain salah dalam mengutip pernyataan tersebut dari Disraeli. Asal perkataan tersebut sebenarnya terjadi pada tahun 1895 di Saratoga Springs, seorang ekonom dan politikus British, Leonard Henry Courtney (1832 – 1918) mengatakan bahwa : “After all, facts are facts, and although we may quote one to another with a chuckle the words of the Wise Statesman, "Lies—damn lies—and statistics," still there are some easy figures the simplest must understand, and the astutest cannot wriggle out of.4 p. 25).”

Dari pernyataan itu sangat mungkin apabila Twain salah mengutip dan mengasumsikan “Wise Statesman” adalah Disraeli. Padahal Leonard Henry Courtney pada saat itu menjelaskan permasalahan statistics dengan cara menghibur melalui kutipan “Wise Statesman “. Menurut Leonard Henry Courtney, “Wise Statesman“ sebenarnya adalah Arthur Yakobus Balfour, orang yang berpengaruh dari partai conservative selama 50 tahun dan bukan Disraeli. Arthur Yakobus Balfour dalam pidato politiknya menyindir lawan politiknya yang menggunakan statistics untuk dalam memalsukan data.

Selanjutnya penulis menerangkan mengani makna “truth”, menurutnya seseorang yang menggunakan statistics untuk kebohongan dan orang yang memahami kutipan (lies, damn lies, and statistics) sebenarnya tidak yakin bahwa tujuan statistics adalah menyesatkan dan ketidak-jujuran. Mengenai “truth” atau kebenaran ini penulis menjabarkan beberapa axiomanya, salah satunya adalah tujuan dari statistics yaitu memfasilitasi penemuan, pemahaman, perhitungan, penemuan model, dan komunikasi fakta mengenai dunia. Berdasarkan axioma ini, berarti tidak mungkin statistics diposisikan sejajar dengan “lies and damn lies”. Dalam penerapan di kehidupan umum, statistics seperti sebagai ”gatekeeper”. Statistics secara significance dibutuhkan dalam ilmu sosial, sebagai contoh dalam ilmu kesehatan, statistics sebagai ”alat bukti”, yang untuk memilih treatment yang tepat secara ilmiah.

Penulis juga menjelaskan mengenai fakta dan proses statistics, statistics memiliki dua arti yaitu statistics berarti data yang dikumpulkan dan statistics berarti proses dan analysis terhadap fakta-fakta untuk mendapatkan arti yang lebih dari data kemudian dari data dapat didefinisikan dan dibuat kesimpulan dan keputusan.

Seakan tidak mau kalah dengan kutipan “damn lies”, penulis menerangkan bahwa statistics merupakan “damn truth”. John Tukey mengatakan bahwa statistics lebih “science” daripada mathematics. Mathematics secara theory dan dalil dapat dikatakan lebih benar, sedangkan untuk statistics harus perlu ilmu yang menyertai agar analisanya dikatakan benar. Misal suatu data statistics, tidak peduli bagaimana benarnya data tersebut, namun apabila cara memperolehnya tidak secara statitics, maka data tersebut tidak dapat digunakan lagi. Statistics lebih membahas masalah empirik daripada masalah teoritis. Statistician bekerja dengan data dan membentuk model dari data tersebut. Pada saat model dan data menyimpang, hal itu merupakan suatu kemajuan dan bukannya suatu kegagalan. Isaac Asimov mengatakan bahwa “The most exciting phrase to hear in science, the one that heralds new discoveries, is not 'Eureka!' but 'That's funny... ‘”

Darimana anggapan “damn lies” itu muncul ? Statistician secara jelas mempertimbangkan kejujuran dan mengakui ketidakpastian mereka. Namun ketika statistician melakukan kesalahan, hal ini dianggap statistician melakukan penipuan yang disengaja dan statistician dianggap gagal. Menurut penulis, ”lies” ini terjadi dari ketidakpastian yang terdapat dalam statistics. Ketidakpastian dalam statistics sebenarnya ”telah dibayar” dengan adanya interval dalam menduga nilai parameter. Tidak cukup dengan itu, statistics juga memberikan nilai pasti dari ketidakpastian interval tersebut. Secara ilmu, statistics bukanlah masalah algoritma atau deterministic (kepastian), masalah dalam statistics terjadi karena sample yang mungkin memberikan jawaban yang berbeda, dan bukan statistician yang bekerja pada sample yang sama memberikan jawaban berbeda.

Kemudian penulis juga menjelaskan mengenai ”statistician judgement”. Statistical analysis atau pengambilan keputusan berdasarkan statistics bukanlah hal yang baru dan termasuk di dalam area pengujian hipotesis. Namun banyak orang yang langsung menginginkan p-value kurang dari 0.05 tanpa mendasarkan pada pertimbangan keilmuan. Sangat mudah untuk menentukan proses hipotesis dalam statistics atau metode ilmiah, namun perlu pertimbangan yang kuat dalam memutuskannya.

Sir Ronald Fisher, penemu experimental design dan analysis of variance, berpendapat bahwa statistician terbiasa dengan p-value kurang dari 0.05 untuk diterima secara statistics, dan inilah juga yang menjadi pedoman bagi statistician hingga saat ini. Yang paling penting bagi pengambil keputusan yang memanfaatkan statistical analysis adalah pengambil keputusan harus memahami masalah yang dihadapi dan pengetahuan tentang ilmu mereka.

Yang dibutuhkan judgement dalam statistics adalah kejujuran. Untuk itu ketepatan dalam mengetahui masalah apa yang akan dibahas merupakan hal penting, terutama dalam proses statistics judgement. Seperti dalam buku William Hunter -"The Practice of Statistics: The Real World is an Idea Whose Time Has Come" mengatakan bahwa pertanyaan utama dari statistician dalam menganalisa sesuatu adalah apa tujuan dari penelitian ini. Dengan mengetahui permasalahan yang akan dianalisa, statistician dapat memperoleh petunjuk yang benar dalam menentukan statistics judgement. Selain itu dengan mengetahui permasalahan yang sebenarnya, kejujuran dalam statistical analysis juga dapat dipertanggungjawabkan. Statistician dalam proses analisanya merupakan proses yang mencari kebenaran dan bukan proses yang mencari-cari kebenaran.

Jika dilihat kembali ke atas, sebenarnya Twain tidak bermaksud mencaci maki statistics, namun lebih pada peringatan untuk masyarakat awam bahwa harus berhati-hati pada data dan output statistics, karena bila salah dalam menafsirkan dapat mengakibatkan kesalahan yang fatal dan menyesatkan. Pendapat Twain ini setidaknya memberikan masukan pada statistician agar dalam statistics judgement tetap diperlukan etika sehingga tidak seolah-olah dibohongi oleh statistics dan membohongi orang lain dengan statistics.(krisnafr)


(diringkas sesuai dengan jurnal asli dengan keterbatasan oleh Krisna Rahmantya)

Monday, December 15, 2008

Ukuran penyebaran

Disebut juga sebagai ukuran variasi atau dispersi, ukuran ini berasal dari pemikiran bahwa ada data yang berada “di sekitar” rata-rata. Ada data yang tepat sama dengan nilai rata-rata, ada yang lebih kecil dan ada juga yang nilainya lebih besar dari rata-rata. Artinya bahwa antara tiap-tiap data dengan rata-rata terdapat jarak atau dispersi, begitu pula dispersi juga terdapat antara data yang satu dengan yang lain. Ukuran variasi antara lain simpangan baku (standard deviation), koefisien variasi (coefficient of variation), jarak (range) dan rata-rata simpangan (mean deviation). Ukuran variasi diperlukan karena ukuran ini memberikan informasi mengenai sebaran nilai pada data tersebut. Selain itu ukuran ini dapat digunakan untuk membandingkan sebaran dari dua distribusi data.

Simpangan baku (standard deviation), ukuran variasi ini paling banyak digunakan karena mempunyai sifat mathematics yang berguna untuk teori dan analisis. Simpangan baku diperoleh dari akar dari ragam (variance). Variance adalah rata-rata dan kuadrat dari selisih tiap-tiap data dengan mean-nya. Simbol untuk variance adalah σ2 atau sigma kuadrat. Simpangan baku memiliki satuan yang sama seperti satuan data aslinya, sehingga kelemahannya apabila membandingkan dua atau lebih data yang berbeda satuan maka pembandingan akan sulit dilakukan.
Variance untuk populasi rumusnya:

Variance untuk sampel rumusnya:
atau
Untuk simpangan baku populasi rumusnya:

Simpangan baku untuk sampel rumusnya:
atau

Terdapat perbedaan pembagi pada populasi dan sampel, pada populasi pembagi adalah n sedangkan pada sampel pembagi adalah n-1. Perbedaan ini karena pada sampel hanya mengestimasi populasi, artinya nilai sampel hanya mendekati dan bukan nilai yang menggambarkan nilai sebenarnya pada populasi. Pembagi pada sampel (n-1) disebut dengan derajat bebas (degree of freedom). Dapat ditunjukan secara statistika matematis bahwa dengan pembagi (n-1), variance sampel merupakan “unbiased estimate” bagi variance populasi.

Nilai jarak (range), merupakan ukuran variasi yang paling sederhana dan mudah untuk dihitung. Data diurutkan dahulu dari yang terkecil hingga terbesar kemudian dihitung selisih antara data terbesar dan data terkecil.
Rumusnya; Nilai jarak = X(n) – X1. Range merupakan ukuran yang kasar untuk n besar dan ukuran ini kurang sensitive, artinya bahwa informasi bisa menyesatkan apabila ada dua data yang memiliki kisaran sama tapi simpangan baku yang berbeda. Range ini tidak selalu dapat menggambarkan keragaman data untuk n besar.

Rata-rata simpangan, seperti namanya perhitungan ini dilakukan dengan cara merata-ratakan simpangan data. Simpangan data adalah selisih tiap-tiap data dengan rata-ratanya. Rata-rata simpangan adalah rata-rata hitung dari nilai absolute dari simpangan, rumusnya:


Koefisien variasi , pengukuran ini bermula dari simpangan baku atau standard deviation yang mempunyai satuan yang sama dengan satuan data aslinya, hal ini merupakan kelemahan apabila kita ingin membandingkan dua atau lebih kelompok data yang satuannya berbeda.
Agar dapat membandingkan dua atau lebih kelompok data dengan satuan yang berbeda maka digunakan Koefisien Variasi (KV), yang bebas dari satuan data asli.
Koefisien variasi untuk populasi

Koefisien variasi untuk sampel

Jika ada dua kelompok data dengan KV1 dan KV2, di mana KV1 > KV2, maka kelompok data pertama lebih bervariasi atau lebih heterogen daripada kelompok data kedua. Koefisien Variasi (KV), dapat juga digunakan untuk menentukan apakah kelompok data tersebut memiliki konsistensi atau tidak. Semakin besar KV maka semakin tidak konsisten, begitu pula sebaliknya semakin kecil KV semakin konsisten.

Ukuran pemusatan 2

Selain mean, median, dan modus yang termasuk ukuran pemusatan adalah kuartil, desil dan persentil. Kuartil adalah nilai-nilai yang membagi pengamatan menjadi 4 bagian yang sama, tentunya setelah data diurutkan dari kecil ke besar maupun sebaliknya. Nilai itu dilambangkan dengan Q1, Q2, dan Q3. Yang termasuk dalam Q1 adalah seluruh data yang berada 25% dibawahnya, untuk Q2 adalah seluruh data yang berada 50% dibawahnya sedangkan Q3 seluruh data yang berada 75% dibawahnya. Nilai Q1 adalah data terakhir dari 25% data pertama dari seluruh data, untuk nilai Q2 adalah data terakhir dari 50% data pertama dari seluruh data dan nilai Q3 adalah data terakhir dari 75% data pertama dari seluruh data. Apabila dilihat dari penjelasan tersebut, diketahui bahwa Q2 sama dengan median. Aplikasi dari kuartil adalah dapat mendeteksi kesetangkupan melalui median dengan cara median = (Q1+Q3)/2.

Desil adalah nilai-nilai yang membagi pengamatan menjadi 10 bagian yang sama setelah data diurutkan. Nilai-nilai itu dilambangkan dengan D1, D2, hingga D9. Sama seperti kuartil, nilai D1 berarti data terakhir dari 10% data pertama dari seluruh data, begitu pula untuk nilai D2 hingga D9. Percentil adalah nilai-nilai yang membagi pengamatan menjadi 100 bagian yang sama setelah data diurutkan. Nilai-nilai itu dilambangkan dengan P1, P2, hingga P99. Nilai P1 berarti data terakhir dari 1% data pertama dari seluruh data, begitu pula untuk P1 hingga P99.

Hubungan antara kuartil dan persentil adalah:
-. Kuartil bawah atau Q1 adalah persentil ke-25.
-. Kuartil tengah atau Q2 adalah persentil ke-50.
-. Kuartil atas atau Q3 adalah persentil ke-75.

Friday, December 12, 2008

“Average” atau “mean”

Mean dalam statistics mempunyai dua arti yaitu arithmetic mean dan expected value (nilai harapan) dari variable. Dalam beberapa hal, mean disebut juga sebagai average. Namun tidak benar apabila mean hanya diartikan sebagai arithmetic mean, karena arithmetic mean berbeda dengan average type lainnya seperti “mean (geometric mean , harmonic mean,dll) ”, “median” dan “modus”. Dari pernyataan ini, dapat juga disimpulkan bahwa mean merupakan bagian average, disamping median dan modus. Sehingga average dapat juga disebut sebagai central tendency, atau pengukuran terhadap pusat data.

Dalam apilkasinya penggunaan kata “average” dan “mean” bergantung pada pemakainya, karena inti dari keduanya sama saja. Hanya saja menggunakan kata mean lebih jelas makna statisticsnya daripada average. Hal ini karena average, meskipun sering disamakan dengan mean, masih belum jelas apakah mean, median atau modus dan dalam keseharian masyarakatpun lebih faham kata-kata “average” daripada “mean” untuk mengartikan rata-rata.

Selain lebih statistics, mean atau mean score dapat diperluas penggunaanya dengan penambahan bobot (weighted) menjadi weighted mean score. Dalam weighted mean score, tiap data yang dihitung meannya masing-masing diberi bobot yang berbeda-beda. Sebenarnya hampir sama dengan mean score (arithmetic mean) atau average yang biasa dilakukan hanya saja jika mean score ini bobot untuk masing-masing data adalah sama yaitu satu, untuk weighted mean score nilai bobotnya berbeda-beda untuk tiap data. Sedangkan istilah average, sampai saat ini masih terbatas untuk arithmetic mean atau mean score(tanpa pembobotan), belum ada dan belum umum istilah weighted average.

Penggunaan istilah ini terserah pada pemakainya, yang terpenting adalah makna yang dimaksud adalah benar rata-rata, sebagai contoh: formula excel dalam mengartikan rata-rata menggunakan (=average) dan bukan (=mean).

Tuesday, December 9, 2008

Ukuran pemusatan

Yang termasuk dalam ukuran pemusatan adalah mean, median, modus, kuartil, desil, dan persentil.

Mean
Mean atau sering disebut rata-rata merupakan nilai yang mewakili seluruh data. Mean punya kecenderungan memusat. Jenis mean antara lain arithmetic mean, geometric mean, harmonic mean, namun yang paling sering digunakan adalah arithmetic mean (rata-rata hitung) atau selanjutnya disebut dengan mean, karena paling mudah digunakan dan diaplikasikan . Prinsip mean adalah menjumlahkan semua data kemudian dibagi banyaknya data. Kelebihan mean adalah nilai mean dapat menggambarkan atau mewakili seluruh data, karena semua data mendapatkan kesempatan dan proporsi yang sama dalam perhitungan atau semua data diperhitungkan dalam proses mendapatkan mean. Namun hal ini justru merupakan kelemahan mean, dengan semua data diperhitungkan artinya jika terdapat data yang nilainya lebih besar atau kecil daripada mayoritas data (data pencilan/outlier) maka nilai mean akan menjadi bias.

Mean dapat juga digunakan dalam data berkelompok. Data berkelompok merupakan data yang telah disempurnakan dalam table frekuensi. Mean dalam data berkelompok dan data tidak berkelompok mempunyai kelebihan masing-masing. Dalam aplikasinya data tidak berkelompok lebih sering digunakan, karena lebih mudah dan lebih menggambarkan data sesungguhnya, terutama bila digunakan untuk proses deskripsi data.Sedangkan dalam data berkelompok, perhitungan mean tidak peka terhadap nilai ekstrim (pencilan/outlier), sehingga seakan-akan kurang menggambarkan distribusi data sebenarnya.

Median
Median merupakan nilai pengamatan atau data yang terletak ditengah-tengah data jika data diurutkan dari terkecil ke terbesar atau sebaliknya. Median juga merupakan data yang di tengah apabila banyaknya data ganjil atau rata-rata kedua data yang di tengah banyaknya data genap. Apabila banyaknya data adalah genap maka median adalah antara pengamatan yang ke-(1/2 n) dan ke-(1/2 n+1), sedangkan untuk n yang ganjil, median adalah pengamatan yang ke-(1/2 n +1). Kelebihan median adalah median tidak dipengaruhi pencilan (outlier) dalam data, namun ini juga bisa menjadi kelemahan karena median tidak melihat data secara keseluruhan. Oleh karena sifat yang seperti ini, median lebih sering digunakan dalam penelitian kualitatif ketimbang penelitian kuantitatif. Untuk data berkelompok, median dihitung dengan rumus sebagai berikut:

Me = Bb + ((1/2*ft – fsm) / fm)*I, di mana:
Me = median
Bb = Batas kelas bawah di mana median terletak, yaitu pada frek. Kumulatif ke-1/2 n
ft =frekuensi total
fsm = frekuensi sebelum kelas yang mengandung median
fm = frekuensi pada kelas yang terdapat median
I = selang atau lebar kelas

Modus
Modus merupakan nilai data dengan frekuensi lebih banyak dari data yang lain. Diantara median dan mean, modus lebih jarang digunakan, karena kurang menggambarkan distribusi data sesungguhnya. Namun terdapat kelebihan dari modus yaitu penggunaanya mudah, modus tidak membutuhkan perhitungan khusus dan dapat digunakan dalam data kualitatif dan kuantitatif.

Hubungan antara mean, median dan modus adalah sebagai berikut:
Modus = 3 * median – 2 * mean
Selain untuk mengukur modus, pengukuran tersebut dapat digunakan untuk mengetahui kesimetrisan distribusi data. Semaikin kecil selisih antara median dan mean maka distribusi data akan semakin simetris dengan modus yang berada di tengah. Apabila distribusi mempunyai kurva yang simetris maka letak atau nilai mean, median dan modus adalah sama pada satu titik.

Bentuk sebaran data dapat diketahui melalui perbandingan mean dan median:
-. Apabila median <> data menjulur ke kanan (skewness to right)
-. Apabila median = rata-rata -> data setangkup
-. Apabila median > rata-rata -> data menjulur ke kiri (skewness to left)

Konsep Deskriptif

Dalam tulisan sebelumnya telah dijelaskan mengenai konsep dalam statistika, salah satu diantaranya adalah konsep deskriptif dan inferensial. Menurut Wallpole, 1995, konsep deskriptif atau yang lebih dikenal dengan statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian data sehingga memberikan informasi yang berguna.

Statistika deskriptif berfungsi meringkas informasi untuk membantu pengambilan keputusan dan meringkas data mentah sehingga didapatkan pola sebaran data dan menyajikan informasi di dalam data, selain itu untuk mendapatkan gambaran tentang bentuk sebaran data yang merupakan dasar pemilihan metode analisa yang tepat . Dalam statistika deskriptif tidak melibatkan peluang (probability) dalam penarikan kesimpulan atau keputusan sehingga penggunaanya sangat terbatas, oleh karena itu dalam proses penarikan kesimpulan statistika deskiptif ini kurang dapat dipertanggung jawabkan. Jadi secara teknis dapat diketahui bahwa dalam statistik deskriptif tidak ada uji signifikansi, tidak aa taraf kesalahan, karena peneliti tidak bermaksud membuat generalisasi, sehingga tidak ada kesalahan generalisasi. Penggunakan mean, median, modus, dan standard deviasi hanya menunjukkan pendugaan pada satu titik saja, tidak dapat diketahui berapa peluang kebenaran maupun kesalahannya dalam menduga suatu parameter populasi. Namun meskipun tidak melibatkan peluang, dalam beberapa kasus aplikasi tertentu penggunaan statistika deskriptif tetap digunakan dalam menentukan kesimpulan dan keputusan.

Pengukuran dalam statistika deskriptif ini terbagi menjadi dua yaitu ukuran pemusatan dan ukuran penyebaran. Ukuran pemusatan merupakan pengukuran terhadap penduga dengan melihat semua data terwakili oleh suatu nilai yang “seolah-olah terpusat” di tengah semua data. Termasuk dalam ukuran pemusatan adalah mean, median, modus, kuartil, desil, dan persentil.

Ukuran penyebaran merupakan penjelasan terhadap data mengenai sebaran, variasi, kehomogenan-keheterogenen dari data. Ukuran ini dapat juga digunakan untuk membandingkan sebaran dua atau lebih distribusi dari data tersebut, misal untuk membandingkan tingkat produktivitas dua atau lebih perusahaan. Yang termasuk ukuran penyebaran meliputi standard deviasi, range, koefisien variasi, standardized value, dan measure of skewness.

Kedudukan keduanya saling melengkapi informasi data, misal rata-rata produksi perusahaan A dan B adalah 100 box dan standar deviasinya masing-masing 20 dan 30. Bila hanya melihat dari mean-nya seakan-akan produksi kedua perusahaan tersebut sama namun apabila melihat dari standar deviasinya maka akan diperoleh informasi tambahan bahwa ternyata perusahaan A lebih homogen daripada perusahaan B.

Thursday, November 27, 2008

Uji Validitas dan Reliabilitas, Mengapa Jarang Digunakan Dalam Survey ?

Dalam blog sebelumnya telah dijelaskan mengenai uji validitas dan reliabilitas data beserta teknis atau rumus perhitungannya. Namun ternyata dalam aplikasi survey, uji validitas dan reliabilitas jarang sekali digunakan. Data yang diperoleh cenderung langsung dimanfaatkan untuk keperluan analisa. Ada beberapa hal yang menyebabkan uji tersebut jarang dan bahkan tidak pernah dilakukan, antara lain:

1. Perhitungan uji validitas dan reliabilitas dilakukan setelah data terkumpul, sehingga apabila ada kesalahan (tidak valid dan tidak reliabel) maka perbaikan sulit dilakukan. Membutuhkan waktu, biaya dan tenaga yang lebih banyak untuk perbaikan.
2. Uji validitas dan reliabilitas dapat dilakukan dipertengahan survey, namun dapat menimbulkan masalah apabila hasil dipertengahan dan diakhir ternyata tetap tidak valid dan tidak reliabel.
3. Selain itu apabila dilakukan dipertengahan survey dapat mengubah metodologi survey yang dilakukan.
4. Secara keseluruhan, sulit dilakukan karena harus disesuaikan dengan metodologi survey.
5. Uji validitas dan reliabilitas dapat dilakukan dengan improvisasi dalam proses survey tersebut. Artinya uji tersebut dilakukan dengan cara lain, misal dalam proses interviewer dan proses pengolahan data (entry data dan cleaning data).

Hal ini menunjukkan bahwa validitas dan reliabilitas data tetap perlu dalam suatu survey, namun tentunya dengan berbagai perubahan dan improvisasi yang disesuaikan dengan metodologi survey tersebut. (krisnafr)

Wednesday, November 26, 2008

Confidence Level

Confidence level disebut juga confidence coefficient, merupakan nilai peluang (1-alpha) dari confidence interval, nilainya berupa persentase yang menunjukkan jumlah sample yang terletak dalam confidence interval. Misal alpha = 0.05 = 5% maka confidence levelnya adalah 1 – 0.05 = 95 %, atau sering dikatakan confidence level 95 %, artinya kita yakin bahwa 95% penduga sample berada dalam selang interval untuk parameter populasi.

Confidence level dapat juga digunakan untuk mengukur reliability hasil yang diperoleh. Nilai yang biasa digunakan confidence level 90%, confidence level 95%, confidence level 99%, dan lain-lain, namun yang sering digunakan confidence level 95%.

Confidence Limits

Confidence limits merupakan batas atas (upper bound) dan batas bawah (lower bound) dari confidence interval. Batas atas confidence interval diperoleh dari penduga titik (point estimate of population parameter) ditambah margin error, sedangkan batas bawah confidence interval diperoleh dari penduga titik dikurangi margin error.

Upper bound = point estimate of population parameter + margin error
Lower bound = point estimate of population parameter - margin error

Confidence interval yang menggunakan batas atas dan batas bawah dalam pendugaannya disebut sebagai two sided confidence interval. Sedangkan yang hanya menggunakan satu confidence limits, baik hanya menggunakan batas atas maupun batas bawah saja, disebut one sided confidence interval. Pemilihan one sided dan two sided ini bergantung pada masalah dan kasus yang dihadapi.

Tuesday, November 25, 2008

Confidence Interval

Confidence interval merupakan interval atau range nilai penduga (estimated value) dari populasi, nilai ini diperoleh dari sample yang dikumpulkan dari populasi tertentu. Confidence interval dapat diartikan pula sebagai penduga interval, apabila diinterpretasikan confidence interval berarti berapa persen (yang kita kehendaki) sample dari populasi yang berada dalam interval atau range parameter populasi.

Sebagai contoh: kita mengukur mean (rata-rata) tinggi badan siswa SMU sekolah X, sample yang kita ambil sebanyak 100 siswa. Agar hasilnya valid dan reliable (baca: validitas, reliabilitas, validitas dan reliabilitas) kita lakukan perhitungan tersebut berulang-ulang, katakanlah 50 kali pengambilan sample, dengan sample 100 siswa yang berbeda-beda. Setelah kita hitung mean tinggi badan siswa, maka hasilnya akan bermacam-macam, misalnya 164.5; 165 cm; 167.5 cm; 163 cm; 166 cm; 165,25 cm, dan seterusnya hingga kita memperoleh 50 mean. Dari contoh ini kita akan kesulitan mengukur keakuratannya apabila menggunakan hanya menggunakan satu mean saja, meskipun mungkin salah satu dari 50 mean tersebut merupakan mean tinggi badan siswa SMU yang sebenarnya. Untuk itu dibutuhkan confidence interval, dengan menggunakan confidence interval dari mean, kita dapat mengetahui keakuratan penduga sampel tersebut dalam menduga parameter populasi.

Salah satu untuk melihat keakuratan interval pendugaan kita adalah dengan melihat confidence levelnya. Seperti yang disebutkan di atas bahwa keakuratan dapat dilihat dari confidence levelnya, semakin tinggi confidence level yang kita gunakan maka semakin akurat pendugaan yang dilakukan artinya apabila researcher menggunakan 100 % confidence level berarti seluruh nilai statistic (penduga) dalam pengambilan sample berada dalam nilai penduga parameter populasi atau statistic (penduga) yang diduga dari sample merupakan statistic pula bagi parameter populasi. Hal ini menunjukkan bahwa kita tidak mentolerir kesalahan dalam pendugaan populasi. Namun karena pertimbangan ekonomis, waktu, tenaga, dan teknis yang sulit dilakukan maka 100 % confidence level jarang bahkan tidak pernah digunakan.

Confidence interval menggunakan persentase, maka yang digunakan antara 1 – 100 %. Confidence interval sering menggunakan confidence level (tingkat kepercayaan) 95% tapi dapat juga menggunakan 90%, 99% dan 99,9 % atau berapapun confidence level untuk populasi yang tidak diketahui.

Confidence interval dapat dihitung dengan rumus sederhana sebagai berikut:
Confidence level = Point estimate of population parameter +/- (confidence factor)(measure variability)(adjusting factor)
atau
Confidence level = Point estimate of population parameter +/- margin error

Monday, November 17, 2008

Konsep Statistika

Ada dua konsep dalam statistika. Pertama, konsep sebagian untuk keseluruhan, konsep ini menjelaskan bahwa dengan statistika researcher tidak perlu meneliti semua obyek (populasi) dalam proses pengambilan keputusan , namun hanya perlu meneliti sebagian obyek saja (sample) yang mewakili keseluruhan obyek tersebut . Konsep ini dikenal dengan sampling method. Seperti yang telah dijelaskan sebelumnya (baca: Sample) bahwa dalam konsep ini terdapat hal yang perlu diperhatikan yaitu perbedaan informasi antara populasi dan sample dapat menyebabkan bias dalam informasi. Semakin besar perbedaan maka bias semakin besar dan begitu pula sebaliknya perbedaan yang kecil maka bias juga kecil. Dengan bias yang kecil menunjukkan bahwa kecil perbedaan antara informasi dalam populasi dan sample, sehingga informasi tersebut dapat kita gunakan untuk keseluruhan obyek atau populasi.

Kedua, konsep deskriptif dan inferensial, atau yang lebih dikenal dengan statistika deskriptif dan statistika inferensial. Menurut Wallpole, 1995, statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian data sehingga memberikan informasi yang berguna. Statistika deskriptif berfungsi meringkas informasi untuk membantu pengambilan keputusan dan meringkas data mentah sehingga didapatkan pola sebaran data dan menyajikan informasi di dalam data, selain itu untuk mendapatkan gambaran tentang bentuk sebaran data yang merupakan dasar pemilihan metode analisa yang tepat .

Statistika inferensial mencakup semua metode yang berhubungan dengan analisis sebagian data untuk kemudian sampai pada peramalan atau penarikan kesimpulan mengenai data, selain itu berfungsi untuk menangani pendugaan parameter, pengujian hipotesis, pembuatan keputusan, penarikan kesimpulan dan peramalan mengenai populasi berdasarkan contoh (generalisasi). Statistika inferensial selalu mempunyai sifat yang tidak pasti, karena mendasarkan pada informasi parsial yang diperoleh dari sebagian data.

Dari penjelasan di atas, seakan-akan terdapat pebedaan antara statistika desktiptif dan statistika inferensial. Statistika deskriptif hanya memberikan informasi mengenai data dan sama sekali tidak dapat digunakan untuk mengambil keputusan, sedangkan untuk mengambil keputusan harus menggunakan statistika inferensial. Padahal secara aplikasi hal tersebut tidak benar, karena konsep statistika inferensial didasarkan pada statistika deskriptif dan meskipun hanya dengan statistika deskriptif, researcher sudah dapat mengambil keputusan dari data yang diperoleh. Keuntungan dari statistika deskriptif adalah konsep ini mudah diaplikasikan dan sederhana dalam proses datanya. Namun secara teoretis apabila ingin menarik kesimpulan dari data dengan hasil yang lebih baik, harus tetap menggunakan konsep statistika inferensial .


Source:
Lawrence s. Aft, Industrial Quality Control, St. Lucie Press
Ronald E. Walpole, Pengantar Statistika, Gramedia

Sunday, November 16, 2008

Teknik Sampling

Teknik sampling merupakan teknik pengambilan sample, teknik ini diperlukan agar sample dapat merepresentasikan atau mewakili populasi, sehingga memperkecil bias (perbedaan) yang diperoleh sample yang diambil dari populasi.

Secara garis besar ada dua teknik sampling, yaitu probability sampling dan nonprobability sampling. Probability sampling adalah sampling dimana obyek dari populasi memiliki peluang yang sama untuk terpilih menjadi anggota sample, sedangkan nonprobability sampling adalah sampling dimana obyek dari populasi memiliki peluang yang tidak sama untuk terpilih menjadi anggota sample, hal ini karena subyektivitas dari peneliti dengan alasan tertentu.

Probability sampling meliputi:
1. Simple random sampling, teknik ini mengambil sample secara acak tanpa memperhatikan strata atau pembagian dalam populasi tersebut.
2. Stratified random sampling, teknik ini dilakukan dengan cara membagi populasi menjadi beberapa bagian atau elemen (nonoverlapping groups), yang disebut strata, dan kemudian sample diperoleh dari beberapa strata (stratum) tersebut dengan teknik simple random sampling.
3. Cluster random sampling, teknik ini mengambil sample dari cluster atau elemen yang telah tersedia. Hampir sama seperti stratified random sampling hanya saja dalam teknik ini cluster atau elemennya sudah ada, sedangkan pada stratified random sampling, elemennya harus ditentukan dahulu. Oleh karena itu, dibanding dua teknik sebelumnya, teknik ini lebih murah karena cluster atau elemenya sudah tersedia.

Nonprobability sampling meliputi:
1. Systematic sampling, teknik pengambilan sample berdasarkan urutan tertentu secara sistematis dari populasi dengan pengambilan urutan pertama secara acak. Teknik ini mudah dilakukan daripada simpel random sample dan stratified random sample, terutama apabila kerangka sample (sample frame) tidak dapat diketahui.
2. Quota sampling, teknik untuk menentukan sample dari populasi yang mempunyai ciri-ciri tertentu samapi jumlah (kuota) yang diinginkan.
3. Purposive sampling, teknik penentuan sample berdasarkan tujuan atau pertimbangan tertentu, misal akan melakukan penelitian tentang kualitas makanan, maka sample data adalah orang yang ahli makanan. Teknik sample ini lebih cocok digunakan untuk penelitian kualitatif, atau penelitian yang tidak melakukan generalisasi.
4. Snowball sampling, teknik penentuan sample yang mula-mula jumlahnya kecil, kemudian membesar. Ibarat bola salju yang menggelinding lama-lama menjadi besar. Teknik ini lebih cocok digunakan untuk penelitian kualitatif.

Source:
Scheaffer, Mendenhall, Ott, Elementary Survey Sampling, PWS Kent
Sugiyono, Metode Penelitian Bisnis, Alfabeta

Thursday, November 13, 2008

Angka Indeks

Angka indeks merupakan suatu angka yang dibuat sedemikian rupa sehingga dapat dipergunakan untuk melakukan perbandingan antara kegiatan yang sama dalam dua waktu yang berbeda. Angka indeks digunakan untuk menghitung nilai variabel relative terhadap variabel yang menjadi periode pada waktu dasar. Dengan indeks dapat diketahui maju mundurnya atau naik turunnya suatu usaha atau kegiatan. Jadi tujuannya adalah untuk mengukur secara kuantitatif terjadinya perubahan dalam dua waktu yang berlainan.

Dalam membuat angka indeks diperlukan dua macam waktu yang berbeda, yaitu waktu dasar (base period) dan waktu bersangkutan atau yang sedang berjalan (current period). Waktu dasar adalah waktu di mana suatu kegiatan (kejadian) dipergunakan sebagai dasar perbandingan, sedangkan waktu yang bersangkutan adalah waktu di mana suatu kegiatan (kejadian) dipergunakan sebagai perbandingan terhadap kegiatan (kejadian) pada waktu dasar.

Macam-macam Indeks
1. Indeks (sesuatu*) relative sederhana.
adalah indeks yang terdiri dari satu macam barang saja.
(*. sesuatu adalah hal atau masalah yang menjadi pokok pembicaraan yang akan diketahui indeksnya, misal: masalah produksi => indeks produksi, masalah konsumsi => indeks konsumsi, masalah harga => indeks harga, dan lain-lain)

di mana :
It,0 = indeks pada waktu t dengan waktu dasar 0
pt = (sesuatu) pada waktu t
p0 = (sesuatu) pada waktu 0
Untuk mendapatkan indeks (sesuatu) bertambah atau berkurang maka :

di mana :
selisih antara dan It dan I0
It,0 = indeks pada waktu t dengan waktu dasar 0

2. Indeks agregatif tidak tertimbang
Indeks agregatif adalah indeks yang terdiri dari beberapa barang. Indeks ini digunakan untuk unit-unit yang mempunyai satuan yang sama. Indeks ini diperoleh dengan jalan memmbagi hasil penjumlahan (sesuatu) pada waktu yang bersangkutan dengan hasil penjumlahan (sesuatu) pada waktu dasar.

di mana :
It,0 = indeks pada waktu t dengan waktu dasar 0
pt = (sesuatu) pada waktu t
p0 = (sesuatu) pada waktu 0
Rumus ini dapat digunakan untuk menghitung indeks sesuatu agregatif asalkan barang-barang mempunyai satuan yang sama. Untuk mengetahui indeks tersebut meningkat atau menurun dapat dihitung dengan formula yang sama seperti pada Indeks Relatif Sederhana

3. Indeks agregatif tertimbang
Indeks yang dalam pembuatannya telah dipertimbangkan faktor-faktor yang akan mempengaruhi naik turunnya angka indeks. Timbangan yang akan digunakan untuk pembuatan indeks, antara lain:
a. Kepentingan relative (relative importance)
b. Hal-hal yang ada hubungannya dan ada pengaruhnya terhadap naik turunnya indeks tersebut. Misal untuk indeks biaya hidup, persentase pengeluaran setiap barang dipergunakan sebagai timbangan (percentage weight).
Kelemahan indeks agregarif tertimbang adalah:
a. Satuan atau unit barang sangat mempengaruhi indeks.
b. Tidak memperhitungkan kepentingan relatif (relative importance) barang-barang yang tercakup dalam pembuatan indeks.

Rumus indeks tertimbang
a. Rumus Laspeyres, menggunakan (sesuatu) pada waktu dasar. Kelebihan dari rumus ini adalah timbangan yang tidak berubah-ubah, namun kelemahan dari rumus ini adalah secara teoretis kurang baik, karena hanya berdasarkan pada waktu dasar saja.

di mana :
It,0 = indeks pada waktu t dengan waktu dasar 0
pt = (sesuatu) pada waktu t
p0 = (sesuatu) pada waktu 0
q0 = (sesuatu) pada waktu 0, sebagai timbangan
Untuk mengetahui peningkatan indeks, perhitungan dapat dilakukan dengan formula yang sama seperti pada Indeks Relatif Sederhana
b. Rumus Paasche, menggunakan (sesuatu) pada waktu t (waktu yang bersangkutan). Kelebihannya adalah baik dari segi teoretis namun dari segi praktis susah sekali diterapkan.

di mana :
It,0 = indeks pada waktu t dengan waktu dasar 0
pt = (sesuatu) pada waktu t
p0 = (sesuatu) pada waktu 0
qt = (sesuatu) pada waktu t, sebagai timbangan
Untuk mengetahui peningkatan indeks, perhitungan dapat dilakukan dengan formula yang sama seperti pada Indeks Relatif Sederhana

4. Angka Indeks Berantai
Indeks ini berguna apabila angka dasar atau waktu berubah-ubah mengikuti waktu sebelumnya. Untuk itu dalam pembuatan indeks berantai ini, harus ditentukan dahulu berapa satuan waktu sebelumnya yang akan digunakan sebagai waktu dasar.

di mana :
qt = (sesuatu) pada waktu t
qt-1 = (sesuatu) pada waktu t-1
Keuntungan menggunakan angka indeks berantai:
a. Memungkinkan kita untuk memasukkan faktor-faktor baru yang diperlukan sebagai bobot.
b. Indeks berantai dapat diturunkan menjadi indeks dengan waktu dasar yang tetap.

Tujuan utama pembuatan angka indeks adalah untuk melakukan perbandingan mengenai suatu kegiatan pada dua waktu yang berbeda (kegiatan produksi, penjualan, konsumsi, perkembangan harga dan lain sebagainya). Di dalam pembuatan angka indeks pada suatu waktu tertentu (minggu tertentu, bulan tertentu, triwulan tertentu, tahun tertentu), harus ditentukan terlebih dahulu waktu dasar (base period) yaitu waktu di mana suatu kegiatan akan dipergunakan sebagai dasar perbandingan.

Ketentuan memilih waktu dasar:
1. Waktu yang dipilih harus menunjukkan keadaan perekonomian yang stabil.
2. Waktu jangan terlalu jauh di belakang.
3. Memperhatikan waktu-waktu khusus, misal terjadi peristiwa penting, hal ini berguna untuk keperluan pembobotan.

Pengujian Angka Indeks
Kebaikan atau kesempurnaan angka indeks biasanya dilihat dari kenyataan apakah indeks yang bersangkutan memenuhi kriteria pengujian (test criteria). Kriteria pengujian yang digunakan adalah time reversal test dan factor reversal test.
1. Time reversal test
Suatu indeks dikatakan memenuhi time reversal test, apabila memenuhi persamaan berikut:
(indeks belum dinyatakan dalam persentase)

di mana :
indeks waktu t dengan waktu dasar 0
indeks waktu 0 dengan waktu dasar t
2. Factor reversal test
Pengujian ini dilakukan dengan cara mencari dulu factor penyusun indeks tersebut. Misal: ada indeks harga, indeks kuantitas, dan indeks nilai. Nilai (v) diperoleh dari perkalian antara harga (p) dan kuantitas (q). Suatu indeks dikatakan memenuhi factor reversal test apabila memenuhi persamaan berikut:

(Indeks harga x indeks kuantitas = indeks nilai)


Source: J. Supranto, Statistik: teori dan aplikasi, Erlangga.

Monday, September 15, 2008

Skema Pengujian Validitas dan Reliabilitas



Daftar Pustaka:
Sugiyono, Metode Penelitian Bisnis (Pendekatan Kuantitatifm Kualitatif dan R&D, Alfabeta, CV, Bandung, 2008

Rumus-rumus Reliabilitas

Reliabilitas

Instrumen pengukuran harus memiliki sifat yang konsisten (stabil) setiap saat agar hasil yang diperoleh merupakan hasil yang konsisten juga. Reliabilitas mendukung validitas danmerupakan syarat perlu namun tidak cukup bagi validitas. Reliabilitas berkaitan dengan estimasi sejauh mana pegukur bebas dari kesalahan atau tidak stabil.

Menurut Cooper dan Emory, 1996, ada tiga perspektif yang digunakan mengenai reliabilitas, yaitu stabilitas, kesamaan dan konsitensi internal. Stabilitas, instrument pengukuran dikatakan stabil apabila menghasilkan hasil-hasil yang konsisten dengan instrument yang sama. Kesamaan, dengan mempertimbangkan kesalahan yang terjadi karena observasi dari unsur-unsur yang diteliti. Cara yang dilakukan adalah dengan mengkorelasikan observasi atau pengamatan dari penilai kemudian dibuat penilaian-penilaian konsistensinya. Konsistensi internal, dengan cara memakai instrumen atau tes satu kali untuk menilai konsistensi atau homogenitas diantara pertanyaan-pertanyaan. Teknik bagi dua (split half) dapat digunakan untuk cara ini.

Berdasarkan Sugiyono, 2008, pengujian reliabilitas dapat dilakukan dengan cara internal dan eksternal. Secara eksternal dengan cara test retest (stability), equivalent, dan gabungan keduanya. Secara internal dengan cara melihat konsistensi antar pertanyaan (Internal consistency).
1. Test retest, metode ini dilakukan dengan cara pengujian yang dilakukan lebih dari satu kali. Tekniknya adalah dengan instrumen yang sama, responden yang sama dan waktu yang berbeda. Kemudian menggunakan korelasi antara pengujian yang pertama dan yang kedua, apabila korelasinya cukup tinggi maka intrumen tersebut reliabel.
2. Ekuivalen, cara ini dilakukan dengan mengubah pertanyaan. Tekniknya dilakukan sekali, tetapi menggunakan instrumen yang berbeda (pertanyaan yang berbeda, tapi maksud sama), responden sama, waktu sama. Kemudian dikorelasi juga antara dua pertanyaan yang berbeda tersebut, apabila korelasi tinggi maka pertanyaan tersebut reliabel.
3. Gabungan, cara ini perpaduan dari cara 1 dan cara 2.
4. Internal consistency, dilakukan dengan mencobakan sekali saja kemudian dianalisis dengan teknik tertentu. Dapat dilakukan dengan teknik belah dua Spearmen Brown (Split half), KR 20, KR 21 dana Anova Hoyt.

Meningkatkan keandalan dapat dilakukan dengan cara meminimumkan sumber variasi eksternal dan membakukan instrumen pengukuran. Selain itu dengan memperbanyak sampel yang digunakan dan menambah surveyor.


Daftar Pustaka:
Cooper, Donald. R, Emory, C. William, Metode Penelitian Bisnis, Erlangga, Jakarta, 1996
Sugiyono, Metode Penelitian Bisnis (Pendekatan Kuantitatif Kualitatif dan R&D), Alfabeta, CV, Bandung, 2008

Ukuran Sampel Ideal

Seperti dijelaskan di awal bahwa sample yang baik adalah yang mewakili populasi, hal ini menyebabkan ada yang berpendapat bahwa sample yang jumlahnya banyak merupakan sample yang ideal. Namun ternyata pendapat itu tidak sepenuhnya benar, dalama Literary Digest disebutkan ternyata ukuran sample hanyalah satu dari ke absahan sample. Ada pula yang mengatakan pula bahwa jumlah sample yang representtif adalah yang berjumlah 10 persen dari jumlah populasinya, namun ternyata hal ini tidaklah benar karena ukuran absolute sample lebih penting daripada ukuran proporsinya terhadap populasi.

“Seberapa besar jumlah sample yang seharusnya diambil adalah fungsi dari variasi pada parameter populasi yang tercakup pada penelitian dan merupakan fungsi dari ketepatan estimasi yang dibutuhkan peneliti” (Coomer & Emory, 1996). Hal yang penting untuk diketahui dalam penarikan ukuran sample adalah tingkat penyebaran data populasi. Semakin luas penyebaran data maka seharusnya semakin banyak sample yang kita ambil agar data populasi terwakili dalam sampel yang kita ambil.

Ukuran sample yang ideal tidak dapat ditentukan secara umum, namun harus berdasarkan desain pengambilan sample (tehnik sampling) yang memadai. Tehnik inilah yang membedakan efisiensi secara statistika dan ekonomis (biaya), tehnik ini pula yang mempengaruhi ukuran sample. Dengan tehnik sampling yang sesuai maka proporsi sample yang diambil akan mewakili banyaknya populasi, karena inilah inti dari sample itu sendiri, yaitu sample harus mewakili jumlah populasi.

Sample

“You don’t have to eat the whole ox that the meat is tough” (Moore, 1993)
Itulah salah satu alasan mengapa digunakan sample untuk mendapatkan informasi, kita tidak perlu meneliti seluruh obyek namun hanya perlu mengambil sebagian dari obyek untuk mendapatkan keseluruhan informasi. Alasan mengapa dalam penelitian digunakan sample karena pertimbangan efisiensi biaya, waktu dan tenaga, terutama apabila populasi berjumlah cukup besar. Permasalahan yang terjadi dari sampling (proses sample) adalah seberapa mewakilinya (representative) sample yang kita pilih terhadap populasi seluruh obyek tersebut.

Perbedaan informasi antara sample dan populasi menyebabkan bias dalam informasi, oleh karena itu sampel yang baik adalah sample yang memiliki bias yang kecil dengan populasi atau sample yang validitas yang tinggi. Menurut Cooper dan Emory, 1996, validitas sample bergantung pada dua hal yaitu akurasi dan ketelitian.

Akurasi adalah sampai sejauh mana sampel tidak dipengaruhi bias, sedangkan ketelitian merupakan dapat diukur dengan kesalahan estimasi standar (standard error of estimate), semakin kecil kesalahan estimasi standar, semakin tinggi ketelitian dari sampel tersebut. Secara umum agar bias sampel kecil yang perlu dilakukan adalah mengambil sampel dari populasi secara merata, metode pengambilan ini merupakan bagian dari metode sampling (sampling methods) atau teknik sampling.

Sunday, September 14, 2008

Gerakan Nasional Pembelajaran Statistika

Jakarta - Tidak jarang dan bahkan bisa disebut selalu di perguruan tinggi mana pun di Indonesia statistika menjadi salah satu momok bagi mahasiswa. Dalam beberapa kali kesempatan berbincang lawan bicara saya memuji keberanian saya untuk menggeluti bidang yang menurut mereka mengerikan.

Banyak orang yang kemudian menghindari bidang ini. Meskipun tidak dapat membuktikan secara empirik. Hal ini menjadi penyebab beberapa kehebohan dan hal-hal yang tidak perlu terjadi di Indonesia.

Fakta yang berkaitan dengan kemunculan varietas Super Toy atau adanya saling klaim pemenang pemilihan kepala daerah (pilkada) di Sumatera Selatan berdasar perkiraan cepat (quick count) menjadi indikasi bahwa rakyat dan bahkan pejabat kita belum cukup melek statistika (statistics literate).

Mari kita lihat dulu fenomena saling klaim pemenang pilkada. Maraknya pilkada di pelosok negeri ini diikuti dengan maraknya bisnis survei dan jasa pelaksanaan quick-count.

Pada prinsipnya kegiatan ini adalah memberikan dugaan besarnya persentase suara dari setiap kandidat peserta pilkada berdasarkan data suara dari sebagian kecil tempat pemungutan suara. Perlu digarisbawahi bahwa hasil perhitungannya adalah dugaan yang tentu memiliki kemungkinan salah.

Tentu saja pelaksananya berupaya meminimumkan kesalahan itu. Tetapi, apa pasti hilang? Tidak. Hanya saja tingkat kesalahannya bisa kecil dengan memilih metode yang tepat dan jumlah sampel TPS (Tempat Pemungutan Suara) yang cukup.

Karena namanya dugaan yang didasarkan pada sebagian TPS hasilnya bisa saja meleset dengan hasil perhitungan suara secara keseluruhan. Dalam banyak buku statistika sering digambarkan orang buta yang disuruh mendeskripsikan gajah.

Kalau dia hanya pegang ekornya saja, sebagian dari tubuh gajah, maka kemungkinan dia akan bilang kalau gajah itu kecil panjang. Beda lagi kalau orang tersebut pas memegang telinganya. Itu kenapa kalau ada dua lembaga melakukan quick-count hasilnya bisa berbeda.

Hasil quick-count juga demikian. Kalau sampel yang diambil kebetulan (tidak
disengaja karena dilakukan secara acak) banyak dari TPS yang merupakan basis pendukung kandidat pertama maka kandidat pertamalah yang diduga menang. Tapi, sebaliknya. Dugaan menang bagi kandidat kedua.

Jadi perlu diingatkan pada masyarakat dan pejabat partai bahwa kalau ada lembaga tertentu mengatakan bahwa kandidatnya menang. Jangan terburu-buru mengadakan pesta kemenangan. Itu kan cuma dugaan. Jadi redaksinya adalah, "Kandidat Anda kami duga menang" bukan "Kandidat Anda menang." Sekali lagi karena hanya dugaan maka bisa salah.

Penyelenggara quick-count tentu saja harus mengemukakan proses pemilihan sampel dan pengihitungan tingkat kesalahannya agar menjadi pijakan yang cukup bagi para simpatisan. Kalau itu tidak disampaikan tidak berlebihan kiranya kalau saya mengatakan bahwa jangan lihat hasil dugaan lembaga penyelenggara quick-count tersebut.

Masyarakat yang tidak paham statistika --termasuk istilah sampel, survei, dan
tingkat kesalahan dugaan, mungkin saja akan menelan mentah-mentah informasi hasil quick-count. Melihat kandidatnya unggul dalam jumlah suara langsung merayakan kemenangan.

Padahal, kalau quick-count mengatakan hasil suara 52%, maka nilai proporsi suara bisa jadi lebih tinggi atau lebih rendah dari itu tergantung tingkat kesalahan prediksinya. Dengan selisih yang semakin jauh dibandingkan lawan Anda bisa lebih yakin dengan kemenangan.

Kasus saling klaim pemenang Pilkada Sumatera Selatan barangkali menjadi gambaran bahwa masyarakat harus diberikan wawasan lebih mengenai statistika. Tentu saja tidak dalam konteks seperti perkuliahan. Saya sangat bergembira kalau setelah ini banyak ahli pendidikan dan pembelajaran menyampaikan ide membangun gerakan nasional pembelajaran statistika.

Bagaimana dengan kasus Super Toy. Kembali kurangnya pemahaman dan kepedulian menggunakan statistika menjadi hal perlu dicurigai. Kenapa demikian?

Varietas yang akan dilempar ke masyarakat tentu harus menjalani proses percobaan yang tidak sederhana. Tapi, juga tidak rumit. Karakteristik agroekosistem varietas tersebut harus dipastikan sehingga lokasi yang dijadikan tempat budi daya sesuai dengan sifat-sifat genetiknya.

Nah, pengambilan kesimpulan ini haruslah didasarkan pada pelaksanaan percobaan yang dirancang dengan baik. Proses multi-location trial yang baik akan memberikan gambaran apakah varietas kita stabil di berbagai agroekosistem atau hanya dapat tumbuh baik di agroekosistem tertentu.

Bahkan, mungkin perlu juga dilakukan pada musim yang berbeda. Pengambilan kesimpulan yang baik memerlukan pula jumlah ulangan yang cukup untuk mendapatkan kesimpulan yang lebih meyakinkan.

Di sinilah adanya tuntutan pemahaman terhadap statistical experimental design yang memadai oleh peneliti. Dia tidak harus seorang statistikawan. Tapi, dia harus punya wawasan cukup untuk itu.

Melibatkan peneliti dari bidang statistika akan menjadi keuntungan tersendiri. Ilmu statistika dapat membantu mendapatkan rancangan yang robust sehingga kesimpulan tentang varietas unggul dapat dilakukan pada berbagai kondisi agroekosistem.

Kaidah ilmiah yang digunakan dalam proses percobaan memiliki sifat dapat diulang (repeatable), sehingga kita bisa lebih teryakinkan dengan hasil yang diperoleh. Percobaan tanpa rancangan dapat memperoleh hasil yang hanya berupa kebetulan. Dengan hasil panen yang kebetulan besar kita tidak boleh melakukan generalisasi.

Lagi-lagi masyarakat dan peneliti serta pejabat harus dapat memahami konteks ini dengan baik. Pengetahuan statistika yang memadai pada berbagai level peran kita di masyarakat akan menghindarkan kita dari kejadian-kejadian kebetulan yang tidak berlaku umum.

Akhirnya, ajakan untuk gerakan nasional pembelajaran statistika perlu mendapat dukungan masyarakat luas. Tidak harus selalu dalam bentuk pembelajaran formal untuk dapat membawa kita memahami statistika dengan lebih baik. Namun, dorongan penyelenggaraan di tingkat formal akan membantu banyak.

Dalam suatu konferensi internasional statistika dan matematika di Bogor awal bulan Agustus 2008 kemarin Profesor Maman Djauhari mengingatkan kepada kita semua bahwa dari sekitar 2.500 perguruan tinggi di Indonesia hanya ada 8 perguruan tinggi yang memiliki jurusan atau departemen statistika.

Bagus Sartono
Van Stralenstraat 100 Antwerpen-Belgium
bagusco4@yahoo.com
+32486889956

(msh/msh)

Source:
http://suarapembaca.detik.com/read/2008/09/13/120141/1005553/471/gerakan-nasional-pembelajaran-statistika

Friday, August 29, 2008

Marketing 2.0

oleh : Hermawan Kartajaya
CEO of MarkPlus Inc.

Internet telah berubah wujud, menjadi 'mutan' yang sama sekali lain. Tepatnya sejak Tim O'Reilly, seorang pakar dunia maya, memproklamasikan lahirnya Web 2.0 pada 2004. Apa itu Web 2.0? Banyak definisinya, tapi gampangnya adalah generasi baru Internet yang memungkinkan pemakai berkomunikasi, berpartisipasi, berinteraksi, berbagi, berkomunitas, atau berkolaborasi satu sama lain.

Kalau dulu dalam format Web 1.0, situs Internet begitu 'angkuh' karena statis, pasif, dan satu arah, kini dalam format Web 2.0 Internet menjadi demikian cool, fun, dan interaktif.

Kenapa bisa begitu? Karena Internet kini diperlengkapi dengan tools baru, sebut saja Web 2.0 tools, seperti blog, tags, wikis, RSS, dig, coComment, Internet messenger (IM), atau Ajax yang memang memungkinkan penduduk Internet berinteraksi intens satu sama lain.

Ambil contoh gampang blog. Dengan blog kita bisa menulis ide apa pun yang berseliweran di kepala kita. Setelah ide ditulis, kita juga bisa mengajak teman-teman untuk aktif berpartisipasi dengan berdiskusi atau sekadar ngobrol, memberikan komentar, menuangkan ide, atau memberi tanggapan. Itu berbeda dengan website yang dahulu kita kenal sebatas tempat mencari informasi.

Contoh lain adalah wikis. Barangkali ada di antara Anda yang sudah akrab dengan ensiklopedia paling komplet di dunia saat ini, yaitu Wikipedia. Anda tahu bagaimana Wikipedia tercipta? Berbeda dengan Ensiklopedia Britanica yang penulisannya dimonopoli oleh penerbitnya, Wikipedia ditulis oleh ribuan 'pakar' berbagai bidang di seluruh dunia yang bekerja secara sukarela dalam platform yang terbuka (open source).

Ribuan penulis Wikipedia tersebut berkolaborasi untuk menulis, mengedit, menyempurnakan informasi untuk mewujudkan ensiklopedia terkomplet di muka Bumi ini. Itu semua dimungkinkan karena adanya Web 2.0 tools, sebuah peranti lunak bernama wikis.

Dengan metamorfosis ini maka Internet pun 3600 berubah wajah: dari informatif menjadi partisipatif; dari interaksi one-way menjadi two-way; dari vertikal (top-down) menjadi horizontal (peer-to-peer); dari one-to-many menjadi many-to-many; dari mainstream menuju ke long tail; dari bersifat individual menjadi komunal/sosial. Meminjam Thomas Friedman, dunia maya sudah benar-benar luluh-lantak menjadi datar. "The world is really flat!" Kalau Internet telah menjadi mutan baru bernama Web 2.0, pertanyaan selanjutnya, apa pengaruhnya bagi dunia pemasaran? Berikut adalah beberapa konsekuensi dan peluang bagi para pemasar. Dari sekian banyak, saya hanya ambil tiga yang penting.

Market is conversations. Kehadiran blog memungkinkan siapa pun membicarakan perusahaan Anda, baik ataupun buruk. Blog (dan blogger) menjadi layaknya KPK yang bisa dengan mudah membongkar 'korupsi informasi' yang dilakukan sebuah perusahaan ke publik. Blog akan menjadi kaca transparan yang memungkinkan siapa pun bisa melihat isi perut perusahaan.

"No place to hide!!!", Anda tak bisa bersembunyi, Anda tak bisa mengelak, Anda tak bisa menjadi tiran yang begitu gampangnya menyensor suara-suara buruk stakeholder Anda. Kalau sudah begitu, yang harus Anda lakukan cuma satu: Join the conversations!!! Mau tidak mau, suka tidak suka, Anda harus melakukan dialog secara jujur, terbuka, dan bertanggung-jawab dengan siapapun yang menjadi stakeholder-nya. Pesannya bagi para pemasar jelas, bahwa trust dan kejujuran akan betul-betul menjadi penentu reputasi dan ekuitas merek Anda. "Trust is your real currency!!!"

Web Get Social. Fenomena paling dominan dari kemunculan Web 2.0 adalah bahwa tools yang dilahirkannya mendorong orang untuk berinteraksi antarsesamanya dan membentuk komunitas.

Kehadiran tools tersebut menjadikan siapa pun di muka Bumi ini begitu gampang membangun jejaring sosial (social networking) di mana mereka bisa begitu intens berinteraksi satu sama lain. Situs-situs seperti MySpace, Facebook, Second Life, YouTube, eBay, Flickr, LinkIn adalah contoh situs-situs yang kini begitu digandrungi karena memungkinkan setiap pengunjungnya berkomunitas dengan teman-teman dari seluruh dunia.

Mereka bisa curhat, berbagi, bersosialisasi, nampang, beropini, merekomendasi, atau memberi nasihat di antara teman-teman yang menjadi komunitasnya. Internet kini telah menjadi media sosial terbesar dalam sejarah umat manusia. PR bagi para marketer: "Ingat!!! Komunitas merupakan media ampuh untuk jualan."

Crowdsourcing & co-creation. Kehadiran Web 2.0 tools seperti blog, folksonomies, Ajax, atau wikis menjadikan pelanggan betul-betul powerful bagi perusahaan. Dengan tools tersebut mereka bisa terlibat dalam hampir semua proses yang ada di dalam perusahaan: riset kebutuhan pelanggan, pengembangan produk, pemasaran, atau customer service.

Coba Anda masuk ke situs-situs Starbuck (lihat www.mystarbucksidea.com), Mountain Dew (www.dewmocracy.com), Lego (www.mindstorms.lego.com) Linux (www.linux.com), Wikipedia (www.wikipedia.com). Dalam kasus-kasus itu Anda akan melihat bagaimana sentralnya peran pelanggan dalam merancang dan membangun produk.

Karena itu, belakangan ini istilah crowdsourcing dan co-creation menjadi begitu populer di dunia Web 2.0. Crowdsourcing adalah upaya menyerahkan sebagian proses di dalam perusahaan kepada komunitas pelanggan (misalnya: Lego Mindstorms dan Starbuck). Sementara co-creation adalah upaya mengajak pelanggan terlibat aktif dalam perancangan dan pengembangan produk (misalnya: Wikipedia dan Linux). Lagi-lagi peluang bagi para pemasar sejauh mungkin libatkanlah pelanggan dalam proses bisnis Anda.

Berbagai perubahan sebagai akibat terbentuknya Web 2.0 di atas menuntut para pemasar menggunakan pendekatan dan paradigma pemasaran baru. Anda para pemasar harus mulai meninggalkan pendekatan pemasaran tradisional (goodby 4Ps!!!) dan mulai bergeser menggunakan pendekatan pemasaran baru. Sebut saja pemasaran tradisional sebagai Marketing 1.0; dan pendekatan pemasaran baru sebagai Marketing 2.0.

Sebagai penutup, ingat PERINGATAN KERAS ini: "Embrace Marketing 2.0, or you will die!!!"

Wednesday, August 27, 2008

Survei: Jangan Jadikan Karyawan TI 'Sapi Perah'

Inggris - Seringkali karyawan TI harus bekerja lembur. Ironisnya, gaji mereka sering tidak sebanding dengan jumlah jam kerja. Ketika mengajukan protes, suara mereka tidak digubris.

Hal ini terungkap dalam sebuah survei yang digelar sebuah situs lowongan kerja di Inggris.

Survei yang melibatkan 500 karyawan TI ini mengungkap bahwa hampir separuh responden bekerja lebih lama daripada yang mereka lakukan dua tahun lalu. Lebih dari seperempat responden bekerja selama 48-60 jam per minggu. Walaupun 3/4 responden mengaku jam kerjanya tidak melebihi peraturan jam kerja di kawasan Eropa, yakni maksimal 48 jam per minggu. Sementara, sekitar 5 persen responden mengaku bekerja selama 60-75 jam dalam seminggu.

Dikutip detikINET dari Vnunet, Rabu (27/8/2008), jumlah jam kerja yang melampaui batas ini merugikan karyawan. Sekitar 40 persen responden menyebutkan bahwa kesehatan mereka menjadi terganggu, 64 persen mengaku bahwa kehidupan sosial mereka menjadi terganggu, dan 41 persen mengaku tidak memiliki kehidupan sosial.

"Majikan harus bertanggung jawab terhadap dampak jumlah jam kerja berlebihan yang dapat merugikan kesehatan karyawan," tandas Alex Farrell, managing director www.theitjobboard.co.uk.

Hanya 10 persen karyawan TI yang mengaku mendapat gaji tambahan untuk kerja lembur, walaupun lebih dari separuhnya mengaku harus membawa pulang pekerjaan tambahan tersebut. Kendati mendapat perlakuan yang kurang adil, hanya 15 responden yang mengaku mengajukan protes kepada pimpinan mereka. Malangnya, sekitar 80 persen dari yang mengajukan komplain mengaku tidak mendapat tanggapan dari pimpinannya.

Bagaimana dengan nasib karyawan TI di Indonesia?Sampaikan pendapat Anda di detikINET Forum!

( faw / dwn )
Fransiska Ari Wahyu - detikinet