Analisis Data Eksploratif : Koefisien Korelasi Pearson

Koefisien korelasi pearson mengukur seberapa erat hubungan antar dua variabel (kuat/lemah) yang disimpulkan dengan menggunakan pola dari diagram pencar mungkin sulit diinterpretasikan secara objektif. Koefisien ini dibutuhkan suatu ukuran untuk mengukur keeratan hubungan antar dua variabel kuantitatif. Koefisien korelasi merupakan ukuran kuantitatif dari tingkat korelasi untuk beberapa tipe korelasi (hubungan), yang menyatakan hubungan secara statistik antara dua variabel.

Nilai koefisien korelasi pearson bernilai antara -1 sampai dengan 1. Nilai +1 menunjukkan tingkatan tertinggi hubungan searah, jika nilai kedua variabel bergerak pada arah yang sama; X dan Y meningkat/ menurun. Nilai -1 menunjukkan tingkatan tertinggi hubungan berlawanan arah, jika nilai kedua variabel bergerak pada arah yang berlawanan; X meningkat dan Y menurun atau sebaliknya.

Sebagai alat analisis, koefisien korelasi memiliki masalah tertentu, termasuk gangguan karena pencilan dan kemungkinan salah menafsirkan untuk menyimpulkan hubungan kausal (sebab-akibat) antara variabel yang dianalisis.

Penukuran koefisien korelasi pearson dikembangkan oleh Karl Pearson. Koefisien korelasi Pearson, sering dikenal (dinotasikan) sebagai โ€œrXYโ€ atau โ€œฯXYโ€ , mengukur kekuatan dan arah hubungan linier antara dua variabel kuantitatif , X dan Y. Merujuk pada Pearson product-moment correlation coefficient. Koefisien korelasi pearson dirumuskan sebagai pembagian antara kovarians antara 2 variabel dengan perkalian standar deviasi dari masing-masing variabel.

Jika terdapat n pengukuran dari X dan Y, dinotasikan dengan xi dan yi untuk i = 1, โ€ฆ, n, maka koefisien korelasi dari sampel dapat digunakan untuk menduga korelasi
Pearson antara X and Y sebagai berikut.

\[ r_{yx} =r_{xy}=\frac{\sum_{i=1}^{n}(x_{i}-\bar{x})(y_{i}-\bar{y})}{\sqrt{\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}\sum_{i=1}^{n}(y_{i}-\bar{y})^{2}}} \]

atau

\[ r=\frac{n\sum_{i=1}^{n}x_{i}y_{i}-\sum_{i=1}^{n}x_{i}\sum_{i=1}^{n}y_{i}}{\sqrt{n\sum_{i=1}^{n}x_{i}^{n}-(\sum_{i=1}^{n}x_{i})^{2}}\sqrt{n\sum_{i=1}^{n}y_{i}^{n}-(\sum_{i=1}^{n}y_{i})^{2}}} \]

Rule of thumb:

0<|rXY|<0.49 : Hubungan lemah

0.50<|rXY|<0.79 : Hubungan sedang

0.80<|rXY|<1 : Hubungan kuat

rXY = +1, jika hubungan X dan Y linier meningkat sempurna. rXY = -1, jika hubungan X dan Y linier menurun sempurna. Interval (-1,1), menunjukkan tingkat hubungan linear antara X dan Y. rXY = 0, jika hubungan X dan Y rendah atau tidak berkorelasi. rXY โˆ“ hubungan antara X dan Y semakin kuat. X dan Y independen, maka r=0, tapi tidak berlaku sebaliknya karena r hanya mendeteksi hubungan linier antara X dan Y.

Berikut ini gambar scatter plot vs besaran dan arah koefisien korelasi pearson.


Materi Lengkap

Silakan baca juga beberapa artikel menarik kami tentang Regresi Liniear Sederhana, daftar lengkapnya adalah sebagai berikut.


Tonton juga video pilihan dari kami berikut ini

https://youtu.be/pVeSwmkaPFU

Bagikan ke teman-teman Anda

Contact Us

How to whitelist website on AdBlocker?

How to whitelist website on AdBlocker?

  1. 1 Click on the AdBlock Plus icon on the top right corner of your browser
  2. 2 Click on "Enabled on this site" from the AdBlock Plus option
  3. 3 Refresh the page and start browsing the site
error: Content is protected !!
Up