確率分布

値がどう出るか、傾向を一覧にする

難易度 Lv 3 / 10想定時間:約20

できるようになること


平均が同じでも、感じ方が違う

次の3つのゲームから1つ選べるとします。

あなたならどれを選びますか。

どのゲームも平均すると1,000円を獲得できます。

では、「どのゲームを選んでも同じだ」と感じるでしょうか。 そう感じる方もいるかもしれませんし、大きな差を感じる方もいるかもしれません。

差を感じる要因は、「どの金額が、どれくらいの確率で起こるか」が違うことにあります。

このどの値をどれくらいの確率でとるのか という対応関係を整理したものが確率分布(probability distribution)です。

確率分布を見ると、平均だけでは分からない出方の違い(ばらつきや極端な値の出やすさ)を比べられるようになります。

確率分布とは何か

確率変数 XX について、XX が取りうる値 xx と、その確率 P(X=x)P(X=x) を対応づけたものを確率分布といいます。

例として、サイコロを1回振って出た目を XX とします。

xx123456
P(X=x)P(X=x)1/61/61/61/61/61/6

この「値 xx と確率 P(X=x)P(X=x) の対応」が確率分布です。

確率分布の表現方法(表・式・グラフ)

確率分布は、目的に応じて次の3つの方法で表します。

1. 表で表現する

値が少ないときは、先ほどのように表で一覧にすると見落としが減ります。

2. 式で表現する

規則性があるときは、式のほうがコンパクトです。先ほどのサイコロなら、

P(X=x)=16,x=1,2,3,4,5,6P(X=x) = \dfrac{1}{6}, \quad x = 1, 2, 3, 4, 5, 6

と書けます。

3. グラフで表現する

棒グラフ(横軸に xx、縦軸に P(X=x)P(X=x))にすると、どこに確率が集まっているかを視覚的に確認できます。

サイコロの確率分布グラフ

確率分布で比較する:3つのゲーム

導入の3つのゲームについて、受け取る金額を確率変数 XX(単位:円)として確率分布を表で書きます。

ゲームA(確実に1,000円)

xx(円)1,000
P(X=x)P(X=x)1.0

ゲームB(コイン投げ)

xx(円)02,000
P(X=x)P(X=x)0.50.5

ゲームC(サイコロ)

xx(円)01,0002,000
P(X=x)P(X=x)1/64/61/6

平均はどれも1,000円です(例えばゲームBは 0×0.5 + 2,000×0.5 = 1,000 です)。

ただし、分布を見ると特徴は異なります。

このように、平均だけでは見えない「ばらつき」 や 「極端な値の出やすさ」 は、確率分布を見てはじめて整理することができます。

確率分布が満たす2つの条件

確率分布は、必ず次の2つを満たします。

1つ目:すべての確率は0以上です。

P(X=x)0P(X=x) \geq 0

2つ目:確率の合計は1です。

xP(X=x)=1\sum_x P(X=x) = 1

この2つを確認すると、確率分布作りの間違いに気づきやすくなります。

よくあるミス:確率の合計が1にならない

例えば、次の表を見てみましょう。

xx123
P(X=x)P(X=x)0.30.40.2

このままだと合計が0.9で、確率分布としては不足しています。 こういうときは、次の3点を順に確認すると直しやすいです。

原因が「丸め」だと分かっているなら、最後に合計が1になるよう調整します。

注意

原因が「漏れ」や「二重計上」かもしれない場合に、いきなり全体を 0.9 で割って正規化する(合計を無理に1にする)のは、問題を隠すことがあります。まず原因の切り分けを優先するのが安全です。

まとめ

確率分布 は、確率変数 XX が取りうる値 xx と、その確率 P(X=x)P(X=x) を対応づけたものです。 表・式・グラフのいずれでも表せますが、目的に応じて使い分けます。

平均が同じでも、確率分布が違えば結果の出方は変わります。 確率分布を作ったら、P(X=x)0P(X=x) \geq 0xP(X=x)=1\sum_x P(X=x) = 1 の2点を確認してください。 合計が1にならないときは、いきなり正規化せず、漏れ・二重計上・丸めのどれが原因かを先に確認します。