Analisis Data Eksploratif : Pengertian Pemeriksaan Kesimetrisan Data dan Q-Q Plot

Pengertian Pemeriksaan Kesimetrisan Data

Prosedur statistik banyak yang dibentuk dengan mengasumsikan data memiliki
sebaran yang simetris. Data yang simetris memiliki grafik seperti kurva distribusi
normal, yaitu berbentuk seperti lonceng, setangkup, seimbang di sisi kiri dan kanan. Sehingga sebelum dilakukan analisis lebih lanjut dan untuk menentukan metode analisis apa yang sesuai harusnya kita tahu kesimetrisan dari data tersebut. Terdapat beberapa cara untuk mengidentifikasi apakah data simetris atau berdistribusi
normal, di antaranya melalui diagram batang dan daun atau melalui diagram kotak.
Identifikasi juga dapat dilakukan melalui plot kuantil-kuantil atau quantile-quantile plot
(Q-Q plot). Kuantil memberikan informasi mengenai posisi data karena kuantil
membagi data menjadi bagian-bagian yang sama.


Pengertian Q-Q Plot

Q-Q Plot (Quantile-Quantile Plot), atau plot kuantil-kuantil, adalah alat grafis untuk membantu kita menguji apakah suatu set data berasal dari beberapa distribusi teoritis seperti berdistribusi normal atau tidak. Contohnya jika kita menjalankan analisis statistik yang mengansumsikan variabel dependen berdistribusi normal, kita dapat menggunakan Q-Q Plot untuk memeriksa asumsi tersebut. Langkah ini hanya sebatas pada pemeriksaan secara visual, sehingga terkesan subjektif. Tetapi memungkinkan kita untuk melihat secara sekilas jika asumsi kita masuk akal. Jika kuantil data empiris dan kuantil distribusi teoritis tersebut berasal dari distribusi yang sama, maka grafik yang diperoleh akan membentuk garis lurus. Misal, Q-Q plot yang dibuat adalah diagram pencar antara kuantil data yang diurutkan terhadap kuantil normal standar yang berkorespondensi dengannya membentuk garis lurus maka data yang dimiliki berdistribusi normal. Q-Q Plot tidak akan memberian informasi yang berguna jika ukuran sampel yang kita gunakan terlalu kecil, sehingga diharapkan sampel yang digunakan berukuran nโ‰ฅ20.

Untuk menentukan kelinieran dari Q-Q Plot, kita dapat menghitung koefisien korelasi titik-titik dalam plot tersebut, yaitu:

\[ r_{Q}=\frac{\sum_{j=1}^{n}(x_{(j)}-\bar{x})(q_{(j)}-\bar{q})}{\sqrt{\sum_{j=1}^{n}(x_{(j)}-\bar{x})^{2}}\sqrt{\sum_{j=1}^{n}(q_{(j)}-\bar{q})^{2}}} \]

r_{Q} merupakan koefisien korelasi antara kuantil data terurut dengan kuantil normal standar. Nilai r_{Q} yang besar menunjukkan terdapat hubungan yang kuat antara x dengan q karena x dan q memiliki distribusi yang sama. Sebagai dasar dalam menyimpulkan, nilai r_{Q} dibandingkan dengan r_{Tabel}, jika r_{Q}>r_{Tabel} maka data berdistribusi normal pada tingkat signifikansi \(\alpha\). Tabel berikut mencantumkan nilai tabel untuk pemeriksaan koefisien korelasi.


Materi Lengkap

Silakan baca juga beberapa artikel menarik kami tentang Kesimetrisan Data, daftar lengkapnya adalah sebagai berikut.


Tonton juga video pilihan dari kami berikut ini

Bagikan ke teman-teman Anda

Contact Us

How to whitelist website on AdBlocker?

How to whitelist website on AdBlocker?

  1. 1 Click on the AdBlock Plus icon on the top right corner of your browser
  2. 2 Click on "Enabled on this site" from the AdBlock Plus option
  3. 3 Refresh the page and start browsing the site
error: Content is protected !!
Up