偏差値という考え方
5点満点(100点満点でも同じ)で、1点、2点、4点、5点の4人が居た場合
a, 平均(averate) = 全員の点数を足して、人数で割る。これはよく使う平均点(値は一つで3点)
b, 偏差(devation) = 個々の点数 – 平均点。プラスなら平均点以上、マイナスなら平均点以下(-2, -1, +1, +2)
c, 分散(variance) = 平均点の近くに集中しているか離れているかの指標(平均点からの距離の平均)。マイナスをプラスするために偏差を二乗してから、人数で割る(4, 1, 1, 4だから、10/4=2.5。値は1つ)
d, 標準偏差(standard deviation) = 分散だと値が多すぎるので平方根(ルート)を取る。ルート2.5 = 1.58。値は1つ
Q1, 標準偏差って、偏差を二乗して平方根を取るんだから、偏差の絶対値の平均じゃダメなの?
A1, ダメ!
偏差の絶対値(2, 1, 1, 2)の平均(1.5)だと、標準偏差の1.58と値が異なる。
偏差の絶対値の平均には、「平均偏差」という名前がついている。
Q2, 「平均偏差」ではなく「標準偏差」を利用するメリットは何?
A2, 実際には「平均偏差」を使っても、そこまで問題はない。
具体的な数値(-2とか)の場合は、絶対値の求め方はマイナスがあったら取り除くだけだが
|x-2|みたいな代数表現だと、場合分け(xが2未満かどうかで、-1を掛け算するかどうか判定)する必要があり、計算工程が煩雑になる。
二乗して平方根を取る時は、こういった煩雑さは無い(人間的には平方根を取るのは簡単じゃないけど…。)
https://qiita.com/kenmatsu4/items/e6c6acb289c02609e619
e, 偏差値(個々の値)
50が基本。平均点を取ったら必ず偏差値は50になる。
計算方法は以下の通り。
偏差値 = 50 + 10( 偏差/標準偏差 )
1, 偏差/標準偏差を計算すると
-1.26, -0.63, 0.63, -1.26
2, 10倍すると
-12.6, -6.3, 6.3, 12.6
3, 50と足し合わせると、偏差値の出来上がり。だいぶ見慣れた値になった!
37.4, 43.7, 56.3, 62.6
まとめ
こうやって順を追って考えてみると、平均点との差分が知りたいのか
単純な偏差でも、結構役に立ちそう。
ただ平均値からマイナス5点、プラス10点よりも、極端な場合(50点の人99人&60点1人の場合)に役に立つ。
全員の合計点 = 5010点
平均点 = 50.1点
偏差 = -0.1の人が99人、+9.9の人が1人
分散 = 0.99(ほとんどの人が平均値。全員が同じ得点なら平均点との差は0なので、分散は必ず0)
標準偏差 = 0.995弱
偏差値 =
50点の99人は、(-0.1/0.995) * 10 + 50 = 偏差値40(平均点から-0.1点)
60点の1人は、(+9.9/0.995) * 10 + 50 = 偏差値150(平均点から+10点)
こういった極端な点数分布の時に、偏差値の真価が現れるのね。
たった二人で、0点と100点の場合も考えてみると
平均 = 50点
偏差 = -50, +50
分散 = 2500
標準偏差 = 50
偏差値 = 40, 60
平均点から、-50点と+50点なのに偏差値的には大した事にならないのね…。
偏差値で極端な値を出すためには、みんなが出来るのに1人だけ出来ないとか、みんなが出来ないのに1人だけできるみたいな「多数派&少数派」みたいな対立が必要なのか…。