2015/02/09

指数分布の意味と具体例


指数分布:確率密度関数が $f(x)=\dfrac{1}{\mu}e^{-\frac{x}{\mu}}\:(x \geq 0)$ であるような連続型確率分布を(平均 $\mu$ の)指数分布と言う。

指数分布の例,重要性,平均の導出,ポアソン分布との関係について。

指数分布の例と重要性

・指数分布はランダムなイベントの発生間隔を表す分布である(後述)ので,指数分布はいろいろなところに登場します。

(おおよそ)指数分布に従う現象の例:

  • 地震が起きる間隔
  • サイトに誰かが訪問するタイミングの間隔
  • 電球の寿命
  • 人とすれ違うタイミングの間隔
  • メールを受信するタイミングの間隔
  • なぜ上記のたくさんの例(ランダムなイベントの発生間隔)が指数分布で表されるのかをなんとなく理解するのがこの記事の目標です!
  • なお,指数分布は確率密度関数が比較的単純なので,分布のいろいろな量を求めるよい計算練習になります。そのため,各種試験(アクチュアリー,大学院入試など)に頻出,という意味でも重要です。

準備(期待値の導出)

1:冒頭の関数は確かに確率密度関数である。

証明

$\displaystyle\int_0^{\infty}f(x)dx=[-e^{-\frac{x}{\mu}}]_0^{\infty}=1$ よりOK。


2:指数分布の平均(期待値)は $\mu$ である。

証明には部分積分,および $\displaystyle\lim_{x\to\infty}xe^{-x}=0$ を用います。

指数分布の平均の証明

$E[X]=\displaystyle\int_0^{\infty}xf(x)dx\\
=\displaystyle\int_0^{\infty}\dfrac{x}{\mu}e^{-\frac{x}{\mu}}dx\\
=\left[-xe^{-\frac{x}{\mu}}\right]_0^{\infty}+\int_0^{\infty}e^{-\frac{x}{\mu}}dx\\
=0+\left[-\mu e^{-\frac{x}{\mu}}\right]_0^{\infty}\\
=\mu$

ちなみに,指数分布の分散は $\mu^2$ です。

ポアソン分布との関係

いよいよランダムなイベントを表す確率モデルについてです。

ランダムな(いつ起こるか分からない,不定期な)イベントは世の中にたくさんあります。指数分布,ポアソン分布はともに,そのようなイベントに関連した分布です。まずは結論から。

単位時間あたり平均 $\lambda$ 回起こるようなランダムなイベントに対して,
1:一単位時間にイベントが起きる回数は平均 $\lambda$ のポアソン分布に従う
2:イベントの発生間隔は平均 $\dfrac{1}{\lambda}$ の指数分布に従う

発生回数が大きいほど発生間隔は長くなることに注意してください。

1についてはポアソン分布の意味と平均・分散で詳しく解説しています。2の証明を以下で行います。

ランダムな現象を「発生回数で捉えるとポアソン分布,発生間隔で捉えると指数分布」と覚えておきましょう。

ランダムなイベントの発生間隔

ランダムなイベントの発生間隔が指数分布であることを証明します。求める確率密度関数を $f(x)$ とおきます。 $f(x)=\lambda e^{-\lambda x}$ であることを証明するのが目標です。

$x <0$ のときは明らかに $f(x)=0$ です。また,求める確率密度関数が滑らか(微分可能)であることは仮定します。

証明

$\Delta x$ が十分小さいとき,時刻 $x$ から $x+\Delta x$ の間にイベントが発生する確率を二通りの方法で求める。

・確率密度関数の定義により $f(x)\Delta x$

・(時刻 $x$ までイベントが起こらない確率)×(それから $\Delta x$ の間に起こる確率)
=$(1-\int_0^xf(t)dt)\times \lambda\Delta x$

よって,
$f(x)=\lambda-\lambda\int_0^{x}f(t)dt$
両辺を $x$ で微分すると,
$f'(x)=-\lambda f(x)$
この微分方程式を解くと,$f(x)=Ce^{-\lambda x}$

確率密度関数であるので $\displaystyle\int_0^{\infty} f(x)dx=1$ となるように定数 $C$ を定めると,$C=\lambda$ を得る。
つまり,$f(x)=\lambda e^{-\lambda x}$

3日間誰からもメールが来ない寂しい時期もあれば,1日に大量にメールが来る日もあるのが納得できます。

Tag: いろいろな確率分布の平均,分散,特性関数などまとめ