最終更新:2019/04/27

ポアソン分布の意味と平均・分散


ポアソン分布とは「一定時間内にランダムなイベントが何回発生するか」を表す分布です。

この記事では,ポアソン分布の意味ポアソン分布の式の導出,そして期待値の計算方法などについて解説します。

ポアソン分布とは

例えば「地震の発生回数」を「ランダムなイベント」とみなすと,「これから $100$ 年間のうちに地震が発生する回数」がポアソン分布で表現できます。

「ランダムなイベント」とは大雑把に言うと「起こる確率が常に一定である」ようなイベントのことです。

なお,地震の発生回数は,厳密にはランダムなイベントではありません。例えば,1回地震が起こると,直後には余震が発生しやすくなります。

ポアソン分布の確率関数

ポアソン分布を表す確率関数は,
$P(k)=e^{-\lambda}\dfrac{\lambda^k}{k!}$
です。

つまり,単位時間あたり平均 $\lambda$ 回起こるようなランダムなイベントが,単位時間に $k$ 回発生する確率が $P(k)$ です。

例えば,(長い時間の平均を取ると)$1$ 年に $3$ 回起こるようなランダムなイベントが,これから $1$ 年のうちにちょうど $2$ 回起こる確率は,
$P(2)=e^{-3}\dfrac{3^2}{2!}\fallingdotseq 0.22$
となります。

$e$ はネイピア数(自然対数の底)で,およそ $2.7$ です。世の中に登場するいろいろな確率を表すポアソン分布が $e$ を使って表せるのが感動ですね。

1回も起こらない確率

ポアソン分布を使って,単位時間あたり平均 $1$ 回起こるようなランダムなイベントが,単位時間に $1$ 回も発生しない確率を計算すると,
$P(0)=e^{-1}\dfrac{1^0}{0!}\fallingdotseq 0.37$

つまり,およそ $37$%です。

ただし,$0!=1$ であることを使いました。
参考:0の階乗を1と定義する理由

ポアソン分布の導出

ポアソン分布を導出します。つまり,以下の定理を証明します。

定理:
単位時間あたり平均 $\lambda$ 回起こるようなランダムなイベントが,単位時間に $k$ 回発生する確率が,ポアソン分布:
$P(k)=e^{-\lambda}\dfrac{\lambda^k}{k!}$
で表せる。

ポアソン分布を二項分布の極限としてとらえます。

証明

以下のように考えて $P(k)$ を求める。

  • 成功確率が $\dfrac{\lambda}{n}$ であるような独立な試行を $n$ 回行う。成功回数の期待値は $n$ によらず $\lambda$ である。
  • $n$ 回の試行のうち $k$ 回成功する確率は,反復試行の確率の公式より,${}_n\mathrm{C}_k\left(\dfrac{\lambda}{n}\right)^k\left(1-\dfrac{\lambda}{n}\right)^{n-k}$ である。
  • $n\to\infty$ としたものが,求める確率 $P(k)$ となるはずである。

ここまで理解できればあとは計算するのみ。極限のよい練習問題。

上記の議論より,
$P(k)=\displaystyle\lim_{n\to\infty}{}_n\mathrm{C}_k\left(\dfrac{\lambda}{n}\right)^k\left(1-\dfrac{\lambda}{n}\right)^{n-k}\\
=\displaystyle\lim_{n\to\infty}\dfrac{n!}{k!(n-k)!}\left(\dfrac{\lambda}{n}\right)^k\left(1-\dfrac{\lambda}{n}\right)^{-k}\left(1-\dfrac{\lambda}{n}\right)^{n}\\
=\displaystyle\lim_{n\to\infty}\dfrac{\lambda^k}{k!}\left(1-\dfrac{\lambda}{n}\right)^{n}\left(1-\dfrac{\lambda}{n}\right)^{-k}\dfrac{n!}{(n-k)!n^k}\\
=e^{-\lambda}\dfrac{\lambda^k}{k!}$
ただし,最後の変形で,
$\displaystyle\lim_{n\to\infty}\left(1-\dfrac{\lambda}{n}\right)^n=e^{-\lambda}$,
$\displaystyle\lim_{n\to\infty}\left(1-\dfrac{\lambda}{n}\right)^{-k}=1$,
$\displaystyle\lim_{n\to\infty}\dfrac{n!}{(n-k)!n^k}=1$
を用いた。

ポアソン分布と指数分布の関係

ポアソン分布は,ランダムなイベントの発生回数を表す分布でした。ポアソン分布の確率変数は「回数」に対応するので,ポアソン分布は離散型確率分布です。

一方,指数分布は,ランダムなイベントの発生間隔を表す分布です。指数分布の確率変数は「時間」に対応するので,指数分布は連続型確率分布です。
参考:指数分布の意味と具体例

ポアソン分布が確率分布であることの確認

$P(k)$ が確率分布であることを確認しておきます。
つまり,$P(k)\geq 0$ かつ $\displaystyle\sum_{k=0}^{\infty}P(k)=1$ を確認します。前者は自明なので後者を証明します。ポアソン分布の解析では指数関数のマクローリン展開が大活躍します。

証明

まず,指数関数のマクローリン展開
$e^x=1+x+\dfrac{x^2}{2!}+\dfrac{x^3}{3!}+\cdots$
において $x=\lambda$ を代入すると,
$e^{\lambda}=\displaystyle\sum_{k=0}^{\infty}\dfrac{\lambda^k}{k!}$ となる。

よって,
$\displaystyle\sum_{k=0}^{\infty}P(k)=
\displaystyle\sum_{k=0}^{\infty}e^{-\lambda}\dfrac{\lambda^k}{k!}\\
=e^{-\lambda}\displaystyle\sum_{k=0}^{\infty}\dfrac{\lambda^k}{k!}\\
=e^{-\lambda}e^{\lambda}=1$

上記の証明が理解できれば,ポアソン分布の平均と分散もほとんど同様な手法で導出できます。

ポアソン分布の平均と分散

ポアソン分布の平均は $\lambda$,分散も $\lambda$

定義に従って計算していくのみです。先ほどと同様に,途中で指数関数のマクローリン展開を用います。

平均の証明

ポアソン分布の平均(期待値)は,
$\displaystyle\sum_{k=1}^{\infty}ke^{-\lambda}\dfrac{\lambda^k}{k!}\\
=\displaystyle\sum_{k=1}^{\infty}e^{-\lambda}\dfrac{\lambda^k}{(k-1)!}\\
=\displaystyle\sum_{k=0}^{\infty}e^{-\lambda}\dfrac{\lambda^{k+1}}{k!}\\
=\lambda\displaystyle\sum_{k=0}^{\infty}e^{-\lambda}\dfrac{\lambda^k}{k!}\\
=\lambda$

分散の方は計算を簡単にするために $V[X]=E[X^2]-E[X]^2$(期待値と分散に関する公式一覧の公式8)を用います。ほとんど同様にしてできるので練習問題にどうぞ!

ポアソン分布を背景とした入試問題があってもいいと思うのですが見つかりませんでした。

Tag: いろいろな確率分布の平均,分散,特性関数などまとめ