MPC – Istilah Statistik dalam Metode Sampling

Parameter vs Statistik

Jika data merupakan data dari populasi, maka nilai karakteristiknya disebut dengan parameter. Sedangkan jika data merupakan data dari sampel, maka nilai karakteristiknya disebut dengan statistik.

Parameter

Parameter adalah sebuah fungsi nilai frekuensi dari seluruh N unit (populasi). Contohnya:

Total

\[ Y_1 + Y_2 + \cdots + Y_N = \sum_{i=1}^{N} Y_i = Y \]

Rata-Rata (Total / Jumlah Unit)

\[ \overline{Y} = \frac{1}{N} \sum_{i=1}^{N} Y_i = \frac{Y}{N} \]

Statistik

Statistik merupakan nilai yang dihitung dari hasil survei sampel mengenai karakteristik, biasanya untuk tujuan membuat estimasi populasi. Jika digunakan untuk membuat estimasi nilai karakteristik populasi, maka disebut sebagai penduga (estimator).

Notasi

No Rincian Populasi Sampel
1 Nilai karakteristik unit ke-i \[ Y_i\] \[ y_i\]
2 Rata-rata nilai karakteristik \[ \overline{Y}\] \[ \overline{y} = \widehat{\overline{Y}}\]
3 Total nilai karakteristik \[ Y\] \[ \widehat{Y}\]
4 Banyaknya unit sampling \[ N\] \[ n\]
5 Varians \[ S^2\] \[ s^2\]
6 Proporsi \[ P\] \[ p = \widehat{P}\]
7 Rasio \[ R\] \[ r = \widehat{R}\]

All Possible Samples

Terdapat 2 teknik dalam pengambilan sampel, yaitu dengan pengembalian dan tanpa pengembalian. Lalu, muncul pertanyaan berikutnya. Bagaimana cara mengetahui jumlah kemungkinan sampel dari 2 cara pengambilan sampel tersebut? Berikut caranya.

With Replacement (WR)

Terdapat sebanyak N kemungkinan sampel

Without Replacement (WOR)

Terdapat sebanyak NCn kemungkinan sampel


Expected Value, Bias, dan Consistent Estimator

Expected Value

Misalkan peluang terpilihnya gugus sampel ke-i adalah Pi dan ΞΈΛ†i adalah estimasi dari gugus sampel ke-i, yang merupakan penduga ΞΈΛ† dari parameter ΞΈ (i = 1, 2, ..., M), M adalah total dari gugus sampel. Maka nilai harapan (expected value) atau rata-rata dari penduga ΞΈΛ† adalah ...

\[ E(\widehat{\theta}) = \sum_{i=1}^{M} P_i \widehat{\theta}_i \]

Jika peluang terpilihnya tiap gugus sampel sama, yaitu Pi = 1 / M, maka berlaku...

\[ E(\widehat{\theta}) = \frac{1}{M} \sum_{i=1}^{M} \widehat{\theta}_i \]

Bias

Penduga ΞΈΛ† dianggap sebagai unbiased estimator (penduga yang tidak bias) dari parameter ΞΈ jika expected value-nya sama dengan parameternya, yaitu...

\[ E(\widehat{\theta}) = \theta \]

Kemudian jika...

\[ E(\widehat{\theta}) \neq \theta \]

maka penduga ΞΈΛ† dapat dianggap sebagai biased estimator (penduga yang bias) dari ΞΈ

Bias dari ΞΈ adalah ...

\[ B(\widehat{\theta}) =E(\widehat{\theta}) - \theta \]

Consistent Estimator

Penduga ΞΈΛ† dikatakan sebagai consistent estimator dari parameter ΞΈ jika nilai ΞΈΛ† akan mendekati ΞΈ seiring dengan peningkatan jumlah sampel


Varians dan Varians Sampling

Varians

Varians menunjukkan tingkat homogenitas / heterogenitas nilai karakteristik unit dalam data yang diamati. Akar dari varians disebut standar deviasi.

  • Untuk varians data populasi, maka variansnya disebut varians populasi dan dilambangkan dengan S2
  • Varians data sampel disebut varians sampel (sample variance) dan dilambangkan dengan s2

Varians Sampling

Varians sampling atau sampling variance dilambangkan dengan V(ΞΈΛ†). Varians sampling menunjukkan tingkat keragaman dari nilai-nilai estimasi atau dengan kata lain mengukur keragaman atau ketepatan dari penduga (estimator).

Akar dari varians sampling disebut standard error atau sampling error biasanya dilambangkan dengan se(ΞΈΛ†). Standard error yang dibagi dengan nilai estimasi karakteristiknya disebut dengan Relative Standard Error (RSE) yang biasanya dinyatakan dalam bentuk persen.

Varians sampling dihitung berdasarkan nilai harapan (expected value) dari deviasi nilai estimasi dengan nilai harapannya, sebagai berikut.

\[ V(\widehat{\theta}) = E[\theta - E(\widehat{\theta})]^2 \] \[ V(\widehat{\theta}) = E(\theta^2) - [E(\widehat{\theta})]^2 \]

Mean Square Error (MSE)

MSE digunakan untuk mengukur keakuratan dari suatu estimator. Nilai estimasi berdasarkan pada observasi terhadap suatu gugus sampel akan berbeda dengan nilai estimasi dari gugus sampel lainnya.

Perbedaan antara estimasi ΞΈΛ†i berdasarkan gugus sampel ke-i dengan parameter ΞΈ disebut kesalahan estimasi (ΞΈΛ†i - ΞΈ). Kesalahan estimasi bervariasi antara gugus sampel yang satu dengan gugus sampel yang lainnya.

Rata-rata ukuran perbedaan dari estimasi-estimasi yang berbeda dari nilai parameternya disebut Mean Square Error (MSE) yang dihitung berdasarkan nilai harapan (expected value) dari kuadrat kesalahan estimasi, yaitu...

\[ E(\widehat{\theta} - \theta)^2 = \sum_{i=1}^{M} P_i (\widehat{\theta} - \theta)^2 \]

MSE adalah jumlah dari varians sampling dan bias kuadrat.

\[ MSE(\widehat{\theta}) = E(\widehat{\theta} - \theta)^2 \] \[ MSE(\widehat{\theta}) = E[\widehat{\theta} - E(\widehat{\theta}) +E(\widehat{\theta}) - \theta ]^2 \] \[ MSE(\widehat{\theta}) = E[\widehat{\theta} - E(\widehat{\theta})]^2 + E[E(\widehat{\theta}) - \theta]^2 \] \[ MSE(\widehat{\theta}) = V(\widehat{\theta}) + [B(\widehat{\theta})]^2 \]

Untuk unbiased estimator, MSE sama dengan varians sampling, karena...

\[ MSE(\widehat{\theta}) = V(\widehat{\theta}) + [B(\widehat{\theta})]^2 \] \[ MSE(\widehat{\theta}) = V(\widehat{\theta}) + 0 \] \[ MSE(\widehat{\theta}) = V(\widehat{\theta}) \]

Confidence Interval

Dari hasil estimasi yang didapat dari satu gugus sampel akan menghasilkan suatu estimasi titik (point estimate). Sebenarnya setiap gugus sampel dari seluruh kemungkinan gugus sampel mempunyai nilai estimasi yang kemungkinan akan berbeda dengan nilai sebenarnya. Seluruh nilai point estimate dari setiap gugus sampel dapat diperkirakan dengan menggunakan estimasi selang (interval estimate) atau confidence interval (1 - Ξ±)%, dengan rumus sebagai berikut.

\[ \widehat{\theta} - z_{\frac{Ξ±}{2}} \cdot se(\widehat{\theta}) < \theta < \widehat{\theta} + z_{\frac{Ξ±}{2}} \cdot se(\widehat{\theta}) \]

Confidence interval (1 - Ξ±)%, artinya jika kita melakukan pemilihan sebanyak n sampel secara berulang selama 100 kali, maka akan terdapat sebanyak 100 selang kepercayaan dan harapannya sebanyak (1 - Ξ±) selang kepercayaan akan memuat nilai parameter, sedangkan sebanyak Ξ± selang kepercayaan tidak memuat nilai parameter.


Akurasi, Efisiensi, dan Presisi

Akurasi

Diukur dari nilai total error. Semakin kecil nilai total error, maka suatu estimator dikatakan semakin akurat.

Efisiensi

Diukur dari besarnya Mean Square Error (MSE). Semakin kecil nilai MSE, maka suatu estimator akan semakin efisien.

Presisi

Diukur dari besarnya varians sampling. Semakin kecil nilai varians sampling, maka suatu estimator akan semakin precise.


Relative Efficiency

Estimator ΞΈΛ†1 dikatakan lebih efisien daripada estimator ΞΈΛ†2 jika...

\[ MSE(\widehat{\theta}_1) < MSE(\widehat{\theta}_2) \]

Besarnya Relative Efficiency (RE) dirumuskan sebagai berikut.

\[ RE_s(\widehat{\theta}_1 | \widehat{\theta}_2) = \frac{MSE(\widehat{\theta}_1)}{MSE(\widehat{\theta}_2)} \]

Estimator ΞΈΛ†1 dikatakan lebih presisi daripada estimator ΞΈΛ†2 jika...

\[ V(\widehat{\theta}_1) < V(\widehat{\theta}_2) \]

Materi Lengkap

Berikut adalah materi lainnya yang membahas mengenai Pengenalan Sampling.


Tonton juga video pilihan dari kami berikut ini

Bagikan ke teman-teman Anda

Contact Us

How to whitelist website on AdBlocker?

How to whitelist website on AdBlocker?

  1. 1 Click on the AdBlock Plus icon on the top right corner of your browser
  2. 2 Click on "Enabled on this site" from the AdBlock Plus option
  3. 3 Refresh the page and start browsing the site
error: Content is protected !!
Up