確率変数Xと確率分布

確率変数Xと確率分布

確率変数Xとは?

確率変数Xには、結果として取りうる値を入れておく。
例えば、サイコロなら、X = {1,2,3,4,5,6}の6パターンしかない。
クジの賞金なら金額を格納する。X = {100,500,1000,5000,10000}
コインの裏表・赤い玉・青いカードなど、結果が数字じゃない場合は、通し番号として0,1,2…のように割り当てておく。
裏=0,裏=1みたいにして、X = {0,1}とする

確率変数Xの確率の表記
サイコロの場合
P(X=3) = 1/6
みたいにProbabilty(確率)の頭文字を使い、確率変数X(結果の値)と組み合わせて、起こる確率を書く。
P(3) = 1/6 みたいにX=を省略してもOK
サイコロのように全部同じ確率なら、P(X) = 1/6 みたいにまとめて書ける。

コインの裏=0,裏=1なら
P(X=0) = 1/2
P(X=1) = 1/2
P(X) = 1/2

確率分布とは?
確率変数Xの値と、その確率を、表や数式で表したもの。
このような結果パターンが有限かつ整数で表せるものを、離散型確率変数という。
逆に、身長や体重のように、理論上無限の結果パターンがあるものを、連続型確率変数という。
表では表せないので、数式で表す(実際には、近似値や有効桁数を使って、正規分布表で表せる)

確率変数の期待値(平均)・分散・標準偏差とは?

ハズレ無しクジ10本で、賞金が一等600円×1、二等200円×3、三等100円×6なら
P(X=600) = 1/10
P(X=200) = 3/10
P(X=100) = 6/10

確率変数の平均は、期待値(Expected Value)と呼ばれ、一回の試行(クジを一回引く)で得られると期待できる値(この場合は賞金)

E(X) = (600*1/10) + (200*3/10) + (100*6/10) = 180円

こうなると、期待値180円プラスマイナスどれくらいの幅があるか、知りたくなる!
正規分布と仮定して、分散(標準偏差)が分かれば、68%、95%、99.7%の幅が分かる!

分散の定義は、各値から平均点引いて、二乗して、個数で割ればいいから(確率も計算に入れる!)

V(X) = (1/10 * (600-180)^2) + (3/10 * (200-180)^2) + (6/10 * (100-180)^2)
= 17640 + 120 + 3840
= 17640 + 120 + 3840
= 21600
σ(X) = 146.96
期待値180円
標準偏差が、およそ147円

33円~327円の幅になる確率が68%

より簡単な分散の計算方法
分散 = 確率変数^2 – 期待値^2 でも計算できる。
V(X) = E(X^2) – μ^2

E(X^2) = (1/10 * 600^2) + (3/10 * 200^2) + (6/10 * 100^2)
E(X^2) = 36000 + 12000 + 6000 = 54000
μ^2 = 180^2 = 32400
V(X) = 54000 – 32400 = 21600
σ(X) = 146.96

サイコロでも同じ計算が出来る
E(X^2) = (1^2+2^2+3^2+4^2+5^2+6^2)/6 = (1+4+9+16+25+36)/6 = 91/6
μ^2 = (7/2)^2 = 49/4
V(X) = E(X^2) – μ^2 だから
V(X) = 91/6 – 49/4 = 35/12
σ(X) = √35/12
サイコロ1個の一様分布の場合、分散って意味あるの?

分散の性質
1, 確率変数に+3など定数を足しても、分散は変化しない(全ての値が単純にスライドするだけ)
2, 確率変数に×2など定数を書けると、分散は2乗倍になる(4倍なら、分散は16倍になる)
3, 分散Aと分散Bは、単純に足し算できる。個数が多いと分散が大きくなる