ベイズは「確率の更新」である
観測で、確率を更新する
できるようになること
- ベイズの定理を使って観測後の事後確率を計算できる
- 事前確率が変わると、同じ観測でも事後確率が変わる理由を説明できる
- 確率の更新を「事前確率・観測・事後確率」の3点セットで整理できる
3回連続で表が出たら「偏り」と言えるか
次の2種類のコインがあります。
- 公平なコイン:表が出る確率 0.5
- 偏りがあるコイン:表が出る確率 0.9
袋の中には、公平なコインが9枚、偏りがあるコインが1枚入っています。 袋から1枚選び、そのコインを3回投げたところ、結果は 表・表・表 でした。
選んだコインが偏りのあるコインである確率は、どれぐらいあるでしょうか。
これを考えるために、事象を次のように置きます。
- :偏りがあるコインを引いた
- :公平なコインを引いた
- :3回とも表が出た
袋の状態から、観測前(投げる前)の見込みは
です。これを事前確率と呼びます。
一方、各コインで3回とも表が出る確率は、
です。これは A, B それぞれが情報として与えられたとき、C がどれだけ起こるかを表しています。
観測によって確率を更新する
知りたいのは、表・表・表という観測 があったときに、そのコインが偏りのあるコインである確率 です。 これを事後確率と呼びます。
ベイズの定理を使うと、
と書けます。分母 は「全体で表・表・表が出る確率」です。 偏りがある場合と公平な場合に分けて、全確率の定理 を用いると、
よって、
数値を代入すると、
したがってこの設定では、
- 観測前:(偏りがあるコインの確率は10%)
- 観測後:(偏りがあるコインの確率は約39.3%)
に更新されます。
もう一回投げたらどうなるか
確率の更新は、1回計算して終わりではありません。観測が増えるたびに確率は更新されます。
例えば4回目も表なら、偏りがあるコインの確率は約53.8%に上がります。 逆に、4回目が裏なら、偏りがあるコインの確率は約11.5%に下がります。
観測が増えるたびに確率が変動することが、更新のイメージです。
何が更新を決めているか
を計算したときの式をもう一度見てみましょう。
更新後の確率を決めているのは主に次の2つです。
- 事前確率 :観測前にどれぐらい偏りがありそうか
- と :各条件(偏りがある/公平)のもとで、観測 がどれぐらい起こりやすいか
今回の例では、「表・表・表」という観測は、公平なコインよりも偏りがあるコインの場合に起きやすい観測です。 そのため観測後は、偏りのあるコインである確率 が観測前の より大きくなります。
一方で、袋の中では偏りがあるコインが少ない()ので、「表・表・表」という観測があっても、偏りのあるコインの確率がすぐ1に近づくわけではありません。
このバランスが上の式に反映されています。
同じ観測でも、事前確率が違うと事後確率が変わる
同じ観測 (表・表・表)でも、袋の中身が変わると更新結果も変わります。 観測の情報量が同じでも、観測前の見込み()が異なるからです。
ケース1:偏りがあるコインが半分
袋に公平なコインが1枚、偏りがあるコインが1枚入っている場合、、 とします。
事後確率は85.4%まで上がります。
ケース2:偏りがあるコインが1%
袋に公平なコインが99枚、偏りがあるコインが1枚入っている場合、、 とします。
事後確率は5.6%にとどまります。
このように、同じ「表・表・表」でも、観測前に偏りがある可能性がどれぐらいあったかで、更新後の確率は大きく変わります。
更新を考えるときの3つのポイント
確率の更新は時に直観に反することがあります。
そのような場合でもきちんと説明するために、次の3つをセットで整理するのがおすすめです。
- 更新前にどれぐらいだと思っていたか(事前確率)
- どんな観測が追加されたか
- 観測後にどれくらいに変わったか(事後確率)
今回の例では、
- 事前確率:10%
- 観測:「表・表・表」
- 事後確率:39.3%
というように整理しておくとよいでしょう。
まとめ
観測前の見込み(事前確率)が、観測を踏まえた見込み(事後確率)に更新されることを確認しました。
更新の結果は、観測そのものだけでなく、観測前にどれぐらい起こりそうだったかという事前確率 にも依存します。同じ観測でも事前確率が違えば事後確率も変わります。
確率の更新を説明するときは、「事前確率・観測・事後確率」の3つをセットで整理してください。