離散分布
取りうる値が「数え上げられる」確率変数を扱う
できるようになること
- 確率変数が離散型かどうかを2ステップで判定できる
- 確率質量関数の定義と2つの性質を説明できる
- 確率質量関数と分布関数の関係を使って相互に変換できる
離散型か、連続型か
次の3つの確率変数は、離散型でしょうか、連続型でしょうか。
- サイコロの目:1, 2, 3, 4, 5, 6
- 来店客数(1日):0人, 1人, 2人, ...
- 身長:170.5cm も 171.2cm も可能
1つ目と2つ目は離散型です。どちらも「中間の値」を取りません(1.5人は存在しません)。 3つ目について、身長という量そのものは連続型です。区間の中のどの値も取りうる、と考えます。
ただし、3つ目については何を確率変数としているかで、離散型にも連続型にもなります。 たとえば「1cm単位で記録した身長(170, 171, 172, …)」を確率変数にするなら離散型です。一方で「実際の身長」を確率変数にするなら連続型になります。
実務では、観測できるのは丸め後の記録値であることも多いので、この違いを理解しておくことは重要になります。
この単元では、離散型の判定基準と、離散型の確率分布の表し方を整理します。
離散型確率変数とは何か
確率変数 が離散型(discrete)であるとは、 が取りうる値を のように「順番に並べて数え上げられる」ということです。
取りうる値の個数は、有限個の場合もあれば、無限個の場合もあります。
- 有限個の例:サイコロの目
- 無限個(可算無限個)の例:来店客数
可算無限個とは、「無限にあるが、1番目、2番目、3番目…と番号を付けて数え上げられる」個数のことです。 離散型では、取りうる値が点として並び、その間の値(例:1と2の間の1.5)は取りません。
離散型かどうかの判定
離散型かどうかを判定するときは、次の2点を順に確認します。
1. その量は「中間の値」を取りうるか
- 人数、回数、個数など:中間の値を取らない → 離散型
- 時間、長さ、重さなど:中間の値も取りうる → 連続型になりやすい(2もチェックする)
2. 何を確率変数としているか(実際の値か、記録された値か)
- 記録値を確率変数にするなら、値が整数などに限られる → 離散型として扱う
- 実際の値を確率変数にするなら、区間の中の値を取りうる → 連続型として扱う
離散型の確率分布:確率質量関数
離散型の確率分布を表す代表的な方法が、確率質量関数です。 で表し、次で定義します。
ここで大事なのは、離散型では確率が「区間」ではなく「点(特定の値)」に割り当てられる、という点です。
例として、サイコロを1回振って出た目を とします。このときの は次のとおりです。
| 1 | 2 | 3 | 4 | 5 | 6 | |
|---|---|---|---|---|---|---|
| 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 |
確率質量関数の性質
確率質量関数は、必ず次の2つの性質を満たします。
1. すべての値で0以上
サイコロの例では、次のように確認できます。
2. 取りうる値について足し合わせると1
サイコロの例では、次のように確認できます。
確率質量関数と分布関数の関係
分布関数は で定義されます。 離散型では、 以下の点の確率を足し合わせることで を作れます。
サイコロの例で を求めると、
分布関数から確率質量関数を求める
が整数値を取るタイプなら、次が使えます。
サイコロなら、 です。
また、取りうる値が のように並べられる場合は、「直前の値までの累積」を引いて求めます。
まとめ
離散型確率変数とは、取りうる値を順番に数え上げられる確率変数です。 離散型の確率分布は、確率質量関数 で表します。
確率質量関数は と を満たします。 分布関数 とは役割が異なります。
- 確率質量関数:「点」の確率(ちょうどその値になる確率)
- 分布関数:「以下」の確率(その値以下になる確率の累積)
離散型では でつながっています。 判定に迷うときは、「中間の値を取るか」「実際の値か記録値か」の2点を順に確認してください。