指数分布

次の事象が起きるまでの待ち時間を扱う

難易度 Lv 4 / 10想定時間：約25分

できるようになること

指数分布の前提を確認し、使えるかどうかを判断できる
$f(x) = \lambda e^{-\lambda x}$ と $F(t) = 1 - e^{-\lambda t}$ を使って確率を計算できる
無記憶性の意味と、それが成り立つ条件を説明できる

次の事象が起きるまでの待ち時間

コールセンターに次の電話がかかってくるまでの時間、機械が故障するまでの時間。

こうした「次の事象が起きるまでの待ち時間」を表す確率分布の一つが指数分布（exponential distribution）です。

ただし、どんな待ち時間でも指数分布に従うわけではありません。無記憶性という特別な性質を持つ場合に限られます。

コールセンターや機械の故障は、この無記憶性が成り立ちやすい典型例のため、指数分布がよく使われます。

ポアソン分布では「単位時間あたり何回起こるか」を扱いました。指数分布は「次の事象が起きるまで何分待つか」という、裏返しの問いに答える分布です。

指数分布とは何か

確率変数 $X$ がパラメータ $\lambda$ の指数分布に従うとき、次のように書きます。

$X \sim \mathrm{Exp}(\lambda)$

ここで、

$X \geq 0$ （待ち時間は負にならない）
$\lambda > 0$ （単位時間あたりの発生率）

$\lambda$ は単位時間あたりの発生率で、単位は「回/時間」です。
平均待ち時間は $\dfrac{1}{\lambda}$ （単位が逆）になります。

1時間あたり平均3件の電話がかかってくる → $\lambda = 3$ （/時間）
1日あたり平均0.1回の故障が起きる → $\lambda = 0.1$ （/日）

指数分布が成り立つための前提

指数分布を使うためには、次の前提が必要です。

前提	意味
1. 事象が独立	ある事象の発生が、次の事象の発生に影響しない
2. 発生率 $\lambda$ が一定	単位時間あたりの発生率が、どの時間帯でも変わらない
3. 開始点が明確	「次の事象までの待ち時間」をどこから測るかが明確に定義されている

これらの前提が成り立つとき、指数分布は無記憶性という特別な性質を持ちます。

確率密度関数

指数分布の確率密度関数は次の式で表されます（ $x \geq 0$ ）。

$f(x) = \lambda e^{-\lambda x}$

グラフは $x = 0$ で最も高く、 $x$ が大きくなるにつれて指数的に減少していきます。 $x = 0$ 付近で確率密度が大きく、短い区間での確率が大きくなりやすいという特徴があります。

ポアソン分布との関係

ポアソン分布と指数分布は密接に関係しています。

ポアソン分布：単位時間あたりの発生回数を表す（離散型）
指数分布：次の発生までの待ち時間を表す（連続型）

同じ前提（独立・発生率一定） のもとで、回数がポアソン分布、待ち時間が指数分布に従います。

両者の関係は次のように理解できます。「待ち時間が $t$ より長い」という事象は、「時間 $t$ までに事象が0回しか起きない」という事象と同じです。

$P(X > t) = P(\text{時間 } t \text{ までに } 0 \text{ 回}) = e^{-\lambda t}$

これがポアソン分布から指数分布の式が導かれる理由です。

確率の計算

「待ち時間が $t$ 以下になる確率」は分布関数で求められます。

$P(X \leq t) = F(t) = 1 - e^{-\lambda t}$

逆に「待ち時間が $t$ より長い確率」は、

$P(X > t) = e^{-\lambda t}$

例： $\lambda = 3$ （/時間）のとき、次の電話が20分以内にかかってくる確率は、

20分 = $\dfrac{20}{60}$ 時間 = $\dfrac{1}{3}$ 時間なので、

$P(X \leq 1/3) = 1 - e^{-3 \times 1/3} = 1 - e^{-1} \approx 0.632$

無記憶性という特徴

指数分布の最も特徴的な性質が無記憶性です。

「すでに $s$ 分待った後、さらに $t$ 分以上待つ確率」は、「最初から $t$ 分以上待つ確率」と同じになります。

$P(X > s + t \mid X > s) = P(X > t)$

具体例：10分待っても電話が来なかった。「さらに5分以上待つ確率」は、最初から「5分以上待つ確率」と変わりません。

これは最初は意外に感じるかもしれません。「もう10分も待ったんだから、そろそろ来るはず」と思いがちですが、指数分布では過去の待ち時間は未来の確率に影響しません。

無記憶性が成り立つのは、各事象が独立に発生し、発生率 $\lambda$ が一定である場合です。実務では、この前提が本当に成り立っているかを確認する必要があります。

無記憶性と指数分布

連続型確率分布の中で、無記憶性を持つのは指数分布だけです。

つまり、「ある現象が無記憶性を持つ」とわかれば、その待ち時間は指数分布に従うと判断できます。逆に、無記憶性が成り立たないなら、指数分布ではありません。

この性質は指数分布を使ってよいかを判断する重要な基準になります。

無記憶性が成り立たない例

コールセンターや機械の故障は無記憶性が成り立ちやすい状況ですが、常に成り立つわけではありません。前提を確認せずに使うと、実態とずれることがあります。

機械の寿命（劣化がある場合）

部品が劣化するため、使用年数が長いほど故障率は上がります。例として、新品で10%だった1年以内の故障確率が、5年使った機械では30%、10年使った機械では50%のように増加します。

このような「過去の使用が未来に影響する」状況では、無記憶性は成り立ちません。

時間帯による変動がある場合

$\lambda$ が時間帯で変わる場合（昼間は $\lambda = 10$ /時間、夜間は $\lambda = 2$ /時間など）、発生率が一定という前提が成り立たなくなります。11時と23時では次の電話が来る確率が明らかに違うため、無記憶性は成り立ちません。

期待値と分散

指数分布 $\mathrm{Exp}(\lambda)$ の期待値と分散は、

期待値： $E[X] = \dfrac{1}{\lambda}$
分散： $V[X] = \dfrac{1}{\lambda^2}$

例：1時間あたり平均3件の電話（ $\lambda = 3$ /時間）なら、次の電話までの平均待ち時間は $\dfrac{1}{3}$ 時間 = 20分です。

期待値が $\dfrac{1}{\lambda}$ になるのは直感的にも納得できます。「単位時間あたり $\lambda$ 回」なら「1回あたり $\dfrac{1}{\lambda}$ 時間」です。

補足：期待値の導出

期待値は定義に従って計算できます。

$E[X] = \int_0^\infty x \cdot \lambda e^{-\lambda x} \, dx$

部分積分（ $u = x$ , $dv = \lambda e^{-\lambda x} dx$ ）を使うと、

$= \left[-x e^{-\lambda x}\right]_0^\infty + \int_0^\infty e^{-\lambda x} \, dx$

$x \to \infty$ のとき $x e^{-\lambda x} \to 0$ （指数関数の減少が支配的）より、第一項は0になります。

$= \int_0^\infty e^{-\lambda x} \, dx = \dfrac{1}{\lambda}$

まとめ

指数分布 $\mathrm{Exp}(\lambda)$ は、次の事象が起きるまでの待ち時間を表す連続分布です。

パラメータ $\lambda$ は単位時間あたりの発生率で、期待値は $\dfrac{1}{\lambda}$ になります。

最も重要な性質は無記憶性で、過去の待ち時間が未来の確率に影響しません。連続型分布の中で無記憶性を持つのは指数分布だけです。

無記憶性は事象が独立に発生し、発生率が一定の場合に成り立ちます。劣化や時間帯による変動がある場合は成り立たないため、前提の確認が重要です。