相関係数は、なんでマイナス1からプラス1までなのか?pythonで相関変数プログラムを組んで、考えてみた。

相関係数は、なんでマイナス1からプラス1までなのか?pythonで相関変数プログラムを組んで、考えてみた。

相関係数(Correlation Coefficient)

相関係数(r) = XYの共分散 / (Xの標準偏差×Yの標準偏差)

数学xと理科yの点数に関係性があるか、相関係数を計算してみる。

分子 = Xのバラツキ×Yのバラツキ(共分散)
分母 = Xのバラツキ×Yのバラツキ(標準偏差x*y)
って、感じだから、何も考えないと相関係数って、常に1/1 = 1になりそう。

分母がベースになるから、XYのバラケ具合を100%と考えて、
分子の要素ごとのバラケ具合の平均を、パーセンテージで出すイメージ?

なんで100%を超えないのだろうか?
x^2 >= x*y
って事?

// xyデータが1個ずつ
x = 10
y = 10
xyの共分散 10*10/1 = 100

// 分散・標準偏差は二乗しているので、必ずプラス
xの分散 10^2/1 = 100
xの標準偏差 √100 = 10
yの分散 10^2/1 = 100
yの標準偏差 √100 = 10

// 相関係数 = 共分散 / (x標準偏差×y標準偏差)
100/10*10 = 1

共分散は、片方がマイナスだと結果もマイナスになるから、相関係数が-1になるのか…。

完全な正比例じゃなくても
比例関係ならプラス1
反比例関係ならマイナス1
になるんだ、なんで?

計算方法は分かったけど、どうしてこうなるのか分からない。パラメータを変化させた時に、計算結果の予想が出来ない!