正規分布

真ん中付近に集まりやすいデータを扱う

難易度 Lv 4 / 10想定時間:約30

できるようになること


なぜ同じ形の分布がいたるところに現れるのか

テストの点数、身長、測定誤差のように、値が真ん中付近に集まり、両端に行くほど少なくなるデータがあります。 この「中心が高く、左右に広がる」形を数式で表した代表が正規分布(normal distribution)です。

正規分布を仮定すると、「ある範囲に入る確率」を同じ手順で計算できるようになります。 たとえば「80点以上の確率」や「平均から±20の範囲に入る割合」といった問いに答えやすくなります。

正規分布の書き方

連続型の確率変数 XX が、平均 μ\mu、分散 σ2\sigma^2 の正規分布に従うとき、次のように書きます。 σ\sigma は標準偏差、σ2\sigma^2 は分散です。

XN(μ,σ2)X \sim N(\mu, \sigma^2)

パラメータμ\muσ\sigmaσ2\sigma^2
意味中心(平均)広がり(標準偏差)広がり(分散)
単位XX と同じXX と同じXX の2乗

確率密度関数

正規分布の確率密度関数は次の形です。式そのものを暗記する必要はありません。 実務上は「μ\muσ\sigma の2つで形が決まる」 ことと、「左右対称で、中心から離れるほど小さくなる」 ことが分かっていれば十分な場面が多いです。

f(x)=12πσ2exp ⁣((xμ)22σ2)f(x) = \dfrac{1}{\sqrt{2\pi\sigma^2}} \exp\!\left(-\dfrac{(x-\mu)^2}{2\sigma^2}\right)

正規分布の確率密度関数

平均 μ\mu と標準偏差 σ\sigma がグラフに与える影響

正規分布の形は、次の2点で把握できます。

また、正規分布は μ\mu を中心に左右対称です。 このため、最頻値・中央値・平均が一致します。

μ と σ の違いによる正規分布の形の変化

「どれぐらいの範囲に入るか」の目安(68.3%・95.4%・99.7%)

正規分布では、中心 μ\mu から標準偏差 σ\sigma の何倍までを見るかで、区間に入る確率の目安が決まります。「平均との差がどれぐらい珍しいか」を考えるときに便利です。

範囲μ±1σ\mu \pm 1\sigmaμ±2σ\mu \pm 2\sigmaμ±3σ\mu \pm 3\sigma
含まれる確率の目安約68.3%約95.4%約99.7%
ヒント

ここでの数値は「正規分布ならこの程度」という目安です。データが正規分布に近いかどうかの確認をせずに、機械的に当てはめないようにします。

68-95-99.7 ルール

標準正規分布と標準化

平均0、分散1の正規分布を標準正規分布といいます。 正規分布の確率計算は、標準化によって「標準正規分布の確率」に置き換えるのが基本手順 です。

ZN(0,1)Z \sim N(0, 1)

XN(μ,σ2)X \sim N(\mu, \sigma^2) のとき、次の変換で標準正規分布に直します。

Z=XμσZ = \dfrac{X - \mu}{\sigma}

標準正規分布の分布関数を Φ(z)=P(Zz)\Phi(z) = P(Z \leq z) と書くことが多いです。 このとき、XX の確率は次の形で計算できます。

P(Xx)=Φ ⁣(xμσ)P(X \leq x) = \Phi\!\left(\dfrac{x - \mu}{\sigma}\right)

例として、XN(60,102)X \sim N(60, 10^2)(平均60、標準偏差10)を仮定し、「80点以上」の確率を考えます。 Z=X6010Z = \dfrac{X - 60}{10} とおくと、X80X \geq 80Z2Z \geq 2 に対応します。

P(X80)=P(Z2)=1Φ(2)P(X \geq 80) = P(Z \geq 2) = 1 - \Phi(2)

Φ(2)0.977\Phi(2) \approx 0.977 なので、確率は約 0.0230.023(約2.3%)になります。

正規近似(離散分布を正規分布で近似する)

二項分布は、条件が整うと正規分布で近似できます。 厳密計算が重いときに、概算として使われます。

Bin(n,p)N ⁣(np,  np(1p))\mathrm{Bin}(n, p) \approx N\!\bigl(np,\; np(1-p)\bigr)

近似を使う目安として、次を満たすかを確認します。

二項分布は離散型、正規分布は連続型なので、確率を近似するときに「連続性の補正(continuity correction)」を入れる場合があります。 使うかどうかは、求めたい確率が境界付近にあるか、nn が十分大きいかで判断します。

期待値と分散

正規分布 N(μ,σ2)N(\mu, \sigma^2) では、パラメータがそのまま期待値と分散になります。

確認ポイント(混同しやすいところ)

まとめ

正規分布は、平均 μ\mu と分散 σ2\sigma^2(標準偏差 σ\sigma)で形が決まる、左右対称の連続分布です。

μ±1σ\mu \pm 1\sigma に約68.3% が入るなど、標準偏差を基準に「どれぐらい珍しいか」を見積もれます。

確率計算は、標準化 Z=XμσZ = \dfrac{X-\mu}{\sigma} によって標準正規分布の確率に置き換えるのが基本手順です。

条件が整えば二項分布などを正規分布で近似でき、概算が必要な場面で役に立ちます。 混同しやすい点(σ\sigmaσ2\sigma^2、確率と確率密度、目安の前提)は確認ポイントで整理してください。