一様分布

すべての値が等しい確率で現れる分布

難易度 Lv 3 / 10想定時間:約20

できるようになること


サイコロの確率からバスの待ち時間へ

公正なサイコロを振ると、1から6の各目が出る確率はどれも 1/61/6 です。どの値も同じ確率で現れる——この性質を持つ分布を一様分布(uniform distribution)と呼びます。

サイコロのように取りうる値が離散的な場合を離散一様分布、バスの到着までの待ち時間のように連続的な場合を連続一様分布と言います。

本単元では、まず離散一様分布に軽く触れた後、連続一様分布を中心に学びます。

離散一様分布

確率変数 XX1,2,,n1, 2, \ldots, nnn 個の値を等確率でとるとき、XX は離散一様分布に従います。

P(X=k)=1n(k=1,2,,n)P(X = k) = \frac{1}{n} \qquad (k = 1, 2, \ldots, n)

:公正なサイコロ(n=6n = 6)なら、各目の出る確率は 1/61/6 で、期待値は E[X]=3.5E[X] = 3.5(1〜6の平均)です。

連続一様分布 U(a,b)U(a, b)

連続一様分布は、区間 [a,b][a, b] のすべての値が等しい確率密度を持つ分布です。

XU(a,b)X \sim U(a, b)

確率密度関数

f(x)={1ba(axb)0(それ以外)f(x) = \begin{cases} \dfrac{1}{b - a} & (a \leq x \leq b) \\ 0 & (\text{それ以外}) \end{cases}

連続一様分布の確率密度関数

グラフは区間 [a,b][a, b] 上の長方形になります。連続分布では密度関数の面積が確率の合計に対応するため、面積が1になることを確認しておきましょう。高さが 1ba\dfrac{1}{b-a} で幅が bab - a なので、面積は 1ba×(ba)=1\dfrac{1}{b-a} \times (b-a) = 1 です。

確率の計算

連続一様分布では、ある区間に入る確率は区間の長さに比例します。

P(cXd)=dcbaP(c \leq X \leq d) = \frac{d - c}{b - a}

:バスが10分間隔(XU(0,10)X \sim U(0, 10))で運行しているとき、3分以内に来る確率は、

P(0X3)=30100=310=0.3P(0 \leq X \leq 3) = \frac{3 - 0}{10 - 0} = \frac{3}{10} = 0.3

期待値と分散

XU(a,b)X \sim U(a, b) のとき、

期待値は区間のちょうど中点です。すべての値が等しい確率で出るのですから、平均が中央になるのは直感的にも納得できます。

U(0,10)U(0, 10) なら、E[X]=5E[X] = 5(分)、Var(X)=100/128.33\mathrm{Var}(X) = 100/12 \approx 8.33 です。

一様分布が成り立つための前提

一様分布を使うには、すべての値が等しい確率で現れることが必要です。シンプルですが、実際の場面ではこの前提が成り立つかを慎重に確認する必要があります。

場面一様分布が使えるか理由
公正なサイコロ✅ 使える各目が等確率で出るように設計されている
等間隔運行のバスの待ち時間✅ 使えるランダムに到着すれば、待ち時間は等確率
乱数生成✅ 使えるU(0,1)U(0, 1) はコンピュータの乱数の基本
摩耗したサイコロ❌ 使えない摩耗により特定の目が出やすくなっている
混雑時のバス❌ 使えない遅延により等間隔ではなくなる
人の身長❌ 使えない平均付近に集中し、極端な値は少ない(正規分布に近い)

応用例

一様分布は「最も情報がない状態」を表すため、他の分析手法の出発点として広く使われます。

乱数生成とシミュレーション

コンピュータで発生させる擬似乱数の基本は U(0,1)U(0, 1)(0から1の一様分布)です。この乱数を変換することで、正規分布やポアソン分布など、あらゆる分布に従う乱数を生成できます。モンテカルロ・シミュレーションもこの仕組みに基づいています。

その他の応用

一様分布は、任意の分布の乱数を U(0,1)U(0, 1) から生成するための理論的基盤(確率積分変換)としても使われています。また、ベイズ統計では事前の情報がないときに「すべての値が等しくありうる」ことを表す無情報事前分布として一様分布を用いることがあります。

まとめ

一様分布は「すべての値が等しい確率で現れる」最もシンプルな分布です。

連続一様分布 U(a,b)U(a, b) の確率密度関数は 1ba\dfrac{1}{b-a}(長方形)、期待値は a+b2\dfrac{a+b}{2}(区間の中点)、分散は (ba)212\dfrac{(b-a)^2}{12} です。

シンプルな分布ですが、乱数生成やシミュレーションの基盤として統計学全体の土台となっています。

一様分布を選ぶ判断基準は、すべての値が等確率で現れると合理的に仮定できるかどうかです。