๐ Daftar Isi
Parameter vs Statistik
Jika data merupakan data dari populasi, maka nilai karakteristiknya disebut dengan parameter. Sedangkan jika data merupakan data dari sampel, maka nilai karakteristiknya disebut dengan statistik.
Parameter
Parameter adalah sebuah fungsi nilai frekuensi dari seluruh N unit (populasi). Contohnya:
Total
Rata-Rata (Total / Jumlah Unit)
Statistik
Statistik merupakan nilai yang dihitung dari hasil survei sampel mengenai karakteristik, biasanya untuk tujuan membuat estimasi populasi. Jika digunakan untuk membuat estimasi nilai karakteristik populasi, maka disebut sebagai penduga (estimator).
Notasi
No | Rincian | Populasi | Sampel |
---|---|---|---|
1 | Nilai karakteristik unit ke-i | \[ Y_i\] | \[ y_i\] |
2 | Rata-rata nilai karakteristik | \[ \overline{Y}\] | \[ \overline{y} = \widehat{\overline{Y}}\] |
3 | Total nilai karakteristik | \[ Y\] | \[ \widehat{Y}\] |
4 | Banyaknya unit sampling | \[ N\] | \[ n\] |
5 | Varians | \[ S^2\] | \[ s^2\] |
6 | Proporsi | \[ P\] | \[ p = \widehat{P}\] |
7 | Rasio | \[ R\] | \[ r = \widehat{R}\] |
All Possible Samples
Terdapat 2 teknik dalam pengambilan sampel, yaitu dengan pengembalian dan tanpa pengembalian. Lalu, muncul pertanyaan berikutnya. Bagaimana cara mengetahui jumlah kemungkinan sampel dari 2 cara pengambilan sampel tersebut? Berikut caranya.
With Replacement (WR)
Terdapat sebanyak N kemungkinan sampel
Without Replacement (WOR)
Terdapat sebanyak NCn kemungkinan sampel
Expected Value, Bias, dan Consistent Estimator
Expected Value
Misalkan peluang terpilihnya gugus sampel ke-i adalah
Pi dan
ฮธหi adalah estimasi dari gugus sampel ke-i
, yang merupakan penduga
ฮธห dari parameter
ฮธ (i = 1, 2, ..., M), M adalah total dari gugus sampel. Maka nilai harapan (expected value) atau rata-rata dari penduga ฮธห
adalah
...
Jika peluang terpilihnya tiap gugus sampel sama, yaitu Pi = 1 / M, maka berlaku...
Bias
Penduga ฮธห dianggap sebagai unbiased estimator (penduga yang tidak bias) dari parameter ฮธ jika expected value-nya sama dengan parameternya, yaitu...
Kemudian jika...
maka penduga ฮธห dapat dianggap sebagai biased estimator (penduga yang bias) dari
ฮธ
Bias dari ฮธ adalah ...
Consistent Estimator
Penduga ฮธห dikatakan sebagai consistent estimator dari parameter ฮธ jika nilai ฮธห akan mendekati ฮธ seiring dengan peningkatan jumlah sampel
Varians dan Varians Sampling
Varians
Varians menunjukkan tingkat homogenitas / heterogenitas nilai karakteristik unit dalam data yang diamati. Akar dari varians disebut standar deviasi.
- Untuk varians data populasi, maka variansnya disebut varians populasi dan dilambangkan dengan S2
- Varians data sampel disebut varians sampel (sample variance) dan dilambangkan dengan s2
Varians Sampling
Varians sampling atau sampling variance dilambangkan dengan V(ฮธห). Varians sampling menunjukkan tingkat keragaman dari nilai-nilai estimasi atau dengan kata lain mengukur keragaman atau ketepatan dari penduga (estimator).
Akar dari varians sampling disebut standard error atau sampling error biasanya dilambangkan dengan se(ฮธห). Standard error yang dibagi dengan nilai estimasi karakteristiknya disebut dengan Relative Standard Error (RSE) yang biasanya dinyatakan dalam bentuk persen.
Varians sampling dihitung berdasarkan nilai harapan (expected value) dari deviasi nilai estimasi dengan nilai harapannya, sebagai berikut.
Mean Square Error (MSE)
MSE digunakan untuk mengukur keakuratan dari suatu estimator. Nilai estimasi berdasarkan pada observasi terhadap suatu gugus sampel akan berbeda dengan nilai estimasi dari gugus sampel lainnya.
Perbedaan antara estimasi ฮธหi berdasarkan gugus sampel ke-
i dengan parameter ฮธ disebut kesalahan estimasi
(ฮธหi - ฮธ). Kesalahan estimasi bervariasi antara gugus sampel yang satu dengan gugus sampel yang lainnya.
Rata-rata ukuran perbedaan dari estimasi-estimasi yang berbeda dari nilai parameternya disebut Mean Square Error (MSE) yang dihitung berdasarkan nilai harapan (expected value) dari kuadrat kesalahan estimasi, yaitu...
MSE adalah jumlah dari varians sampling dan bias kuadrat.
Untuk unbiased estimator, MSE sama dengan varians sampling, karena...
Confidence Interval
Dari hasil estimasi yang didapat dari satu gugus sampel akan menghasilkan suatu estimasi titik (point estimate). Sebenarnya setiap gugus sampel dari seluruh kemungkinan gugus sampel mempunyai nilai estimasi yang kemungkinan akan berbeda dengan nilai sebenarnya. Seluruh nilai point estimate dari setiap gugus sampel dapat diperkirakan dengan menggunakan estimasi selang (interval estimate) atau confidence interval (1 - ฮฑ)%, dengan rumus sebagai berikut.
Confidence interval (1 - ฮฑ)%, artinya jika kita melakukan pemilihan sebanyak n sampel secara berulang selama 100 kali, maka akan terdapat sebanyak 100 selang kepercayaan dan harapannya sebanyak (1 - ฮฑ) selang kepercayaan akan memuat nilai parameter, sedangkan sebanyak ฮฑ selang kepercayaan tidak memuat nilai parameter.
Akurasi, Efisiensi, dan Presisi
Akurasi
Diukur dari nilai total error. Semakin kecil nilai total error, maka suatu estimator dikatakan semakin akurat.
Efisiensi
Diukur dari besarnya Mean Square Error (MSE). Semakin kecil nilai MSE, maka suatu estimator akan semakin efisien.
Presisi
Diukur dari besarnya varians sampling. Semakin kecil nilai varians sampling, maka suatu estimator akan semakin precise.
Relative Efficiency
Estimator ฮธห1 dikatakan lebih efisien daripada estimator ฮธห2 jika...
Besarnya Relative Efficiency (RE) dirumuskan sebagai berikut.
Estimator ฮธห1 dikatakan lebih presisi daripada estimator ฮธห2 jika...
Materi Lengkap
Berikut adalah materi lainnya yang membahas mengenai Pengenalan Sampling.