ポアソン分布の意味と平均・分散

ポアソン分布とは「一定時間内にランダムなイベントが何回発生するか」を表す分布。

ポアソン分布について,意味・練習問題・確率関数の導出・期待値の計算方法を紹介します。

ポアソン分布とは

ポアソン分布は,ランダムなイベントの発生回数を表す分布です。

地震の発生回数を「ランダムなイベント」とみなすと,「これから 100100 年間のうちに地震が発生する回数」がポアソン分布で計算できる。

※「ランダムなイベント」とは大雑把に言うと「起こる確率が常に一定である」ようなイベントのことです。

ポアソン分布の確率関数

ポアソン分布の確率関数

P(k)=eλλkk!P(k)=e^{-\lambda}\dfrac{\lambda^k}{k!}

つまり,単位時間あたり平均 λ\lambda 回起こるようなランダムなイベントが,単位時間に kk 回発生する確率P(k)=eλλkk!P(k)=e^{-\lambda}\dfrac{\lambda^k}{k!} です。

例えば,λ=3\lambda=3 の場合の確率関数は図のようになる。 ポアソン分布 11 年に 平均 33 回起こるようなランダムなイベントが,これから 11 年のうちにちょうど 22 回起こる確率は,
P(2)=e3322!0.22P(2)=e^{-3}\dfrac{3^2}{2!}\fallingdotseq 0.22

と計算できる。

ポアソン分布の確率の計算は,例えば WolframAlpha に(2.7182818^{-3}3^2)/2! と入力すればできます。

ee はネイピア数(自然対数の底)で,およそ 2.72.7 です。世の中に登場するいろいろな確率を表すポアソン分布が ee を使って表せるのがおもしろいです。

練習問題:1回も発生しない確率

問題

単位時間あたり平均 11 回起こるようなランダムなイベントが,単位時間に 11 回も発生しない確率はいくらか?

解答

λ=1\lambda=1k=0k=0 としてポアソン分布の確率関数を計算すると,

P(0)=e1100!0.37P(0)=e^{-1}\dfrac{1^0}{0!}\fallingdotseq 0.37

つまり,およそ 3737 %。

ただし,0!=10!=1 であることを使いました。

参考:0の階乗を1と定義する理由

ポアソン分布の導出

ポアソン分布を導出します。つまり,以下の定理を証明します。

定理

単位時間あたり平均 λ\lambda 回起こるようなランダムなイベントが,単位時間に kk 回発生する確率が,ポアソン分布:

P(k)=eλλkk!P(k)=e^{-\lambda}\dfrac{\lambda^k}{k!}

で表せる。

ポアソン分布を二項分布の極限としてとらえます。

証明

以下のように考えて P(k)P(k) を求める。

  • 成功確率が λn\dfrac{\lambda}{n} であるような独立な試行を nn 回行う。成功回数の期待値は nn によらず λ\lambda である。
  • nn 回の試行のうち kk 回成功する確率は,反復試行の確率の公式より,nCk(λn)k(1λn)nk{}_n\mathrm{C}_k\left(\dfrac{\lambda}{n}\right)^k\left(1-\dfrac{\lambda}{n}\right)^{n-k} である。
  • nn\to\infty としたものが,求める確率 P(k)P(k) となるはずである。

ここまで理解できればあとは計算するのみ。極限のよい練習問題。

上記の議論より,

P(k)=limnnCk(λn)k(1λn)nk=limnn!k!(nk)!(λn)k(1λn)k(1λn)n=limnλkk!(1λn)n(1λn)kn!(nk)!nk=eλλkk!P(k)=\displaystyle\lim_{n\to\infty}{}_n\mathrm{C}_k\left(\dfrac{\lambda}{n}\right)^k\left(1-\dfrac{\lambda}{n}\right)^{n-k}\\ =\displaystyle\lim_{n\to\infty}\dfrac{n!}{k!(n-k)!}\left(\dfrac{\lambda}{n}\right)^k\left(1-\dfrac{\lambda}{n}\right)^{-k}\left(1-\dfrac{\lambda}{n}\right)^{n}\\ =\displaystyle\lim_{n\to\infty}\dfrac{\lambda^k}{k!}\left(1-\dfrac{\lambda}{n}\right)^{n}\left(1-\dfrac{\lambda}{n}\right)^{-k}\dfrac{n!}{(n-k)!n^k}\\ =e^{-\lambda}\dfrac{\lambda^k}{k!}

ただし,最後の変形で,

limn(1λn)n=eλ\displaystyle\lim_{n\to\infty}\left(1-\dfrac{\lambda}{n}\right)^n=e^{-\lambda}

limn(1λn)k=1\displaystyle\lim_{n\to\infty}\left(1-\dfrac{\lambda}{n}\right)^{-k}=1

limnn!(nk)!nk=1\displaystyle\lim_{n\to\infty}\dfrac{n!}{(n-k)!n^k}=1

を用いた。

ポアソン分布と指数分布の関係

ランダムなイベントに関する確率分布として,ポアソン分布の他に指数分布があります。比較してみましょう。

  • ポアソン分布は,ランダムなイベントの発生回数を表す分布でした。ポアソン分布の確率変数は「回数」を表すので,ポアソン分布は離散型確率分布です。

  • 一方, 指数分布は,ランダムなイベントの発生間隔を表す分布です。指数分布の確率変数は「時間」を表すので,指数分布は連続型確率分布です。

参考:指数分布の意味と具体例

ポアソン分布が確率分布であることの確認

P(k)P(k) が確率分布であることを確認しておきます。

つまり,P(k)0P(k)\geq 0 かつ k=0P(k)=1\displaystyle\sum_{k=0}^{\infty}P(k)=1 を確認します。前者は自明なので後者を証明します。ポアソン分布の解析では指数関数のマクローリン展開が大活躍します。

証明

まず,指数関数のマクローリン展開

ex=1+x+x22!+x33!+e^x=1+x+\dfrac{x^2}{2!}+\dfrac{x^3}{3!}+\cdots

において x=λx=\lambda を代入すると,

eλ=k=0λkk!e^{\lambda}=\displaystyle\sum_{k=0}^{\infty}\dfrac{\lambda^k}{k!} となる。

よって,

k=0P(k)=k=0eλλkk!=eλk=0λkk!=eλeλ=1\displaystyle\sum_{k=0}^{\infty}P(k)= \displaystyle\sum_{k=0}^{\infty}e^{-\lambda}\dfrac{\lambda^k}{k!}\\ =e^{-\lambda}\displaystyle\sum_{k=0}^{\infty}\dfrac{\lambda^k}{k!}\\ =e^{-\lambda}e^{\lambda}=1

上記の証明が理解できれば,ポアソン分布の平均と分散もほとんど同様な手法で導出できます。

ポアソン分布の平均と分散

ポアソン分布の平均は λ\lambda,分散も λ\lambda

定義に従って計算していくのみです。さきほどと同様に,途中で指数関数のマクローリン展開を用います。

平均の証明

ポアソン分布の平均(期待値)は,

k=1keλλkk!=k=1eλλk(k1)!=k=0eλλk+1k!=λk=0eλλkk!=λ\displaystyle\sum_{k=1}^{\infty}ke^{-\lambda}\dfrac{\lambda^k}{k!}\\ =\displaystyle\sum_{k=1}^{\infty}e^{-\lambda}\dfrac{\lambda^k}{(k-1)!}\\ =\displaystyle\sum_{k=0}^{\infty}e^{-\lambda}\dfrac{\lambda^{k+1}}{k!}\\ =\lambda\displaystyle\sum_{k=0}^{\infty}e^{-\lambda}\dfrac{\lambda^k}{k!}\\ =\lambda

分散の方は計算を簡単にするために V[X]=E[X2]E[X]2V[X]=E[X^2]-E[X]^2期待値と分散に関する公式一覧の公式8)を用います。ほとんど同様にしてできるので練習問題にどうぞ!

なお,地震の発生回数は,厳密にはランダムなイベントではありません。例えば,1回地震が起こると,直後には余震が発生しやすくなります。

Tag:いろいろな確率分布の平均,分散,特性関数などまとめ