2015/04/27

幾何分布の具体例と期待値,無記憶性について

分野: データの分析,確率  レベル: 最難関大学

幾何分布:$P(n)=(1-p)^{n-1}p$ で表される離散型確率分布を幾何分布と言う。

「幾何分布」という言葉は高校数学では登場しませんが,内容は高校の確率レベルです。

幾何分布の意味

確率 $p$ で成功するような試行を繰り返し行う状況を考えます。 $n$ 回目に初めて成功する確率は,$(n-1)$ 回連続で失敗して $n$ 回目に成功する確率なので,$P(n)=(1-p)^{n-1}p$ となります。

つまり,同じことを繰り返し行うとき,初めて成功するまでの回数が従う分布が幾何分布です。

注:「成功するまでにかかる回数」ではなく「連続して失敗する回数」が従う分布を幾何分布と言う場合もあります。その場合回数のカウントが1ずれるので注意して下さい。

具体例

幾何分布の具体例を3つ紹介します。

例1

二人でじゃんけんを行う。何回目で決着がつくか(例えばあいこがちょうど2回続いた場合は3回目で決着がついたとみなす),その回数は $p=\dfrac{2}{3}$ の幾何分布に従う。

例2

サイコロを投げる。6が出るまでにかかる回数は $p=\dfrac{1}{6}$ の幾何分布に従う。

例3

打率3割の打者が初ヒットを何打席目に打つか,その回数は $p=0.3$ の幾何分布に従う。

注:打率はピッチャーとの相性やその日の体調にもよるので厳密には幾何分布ではありません。

幾何分布の期待値と分散

幾何分布の期待値は $\dfrac{1}{p}$ ,分散は $\dfrac{1-p}{p^2}$

成功するまでに約 $\dfrac{1}{p}$ 回やらないといけない(失敗する回数でカウントすると $\dfrac{1}{p}-1$ 回)という訳です。

  • 例1において,じゃんけんが続く回数の期待値は $\dfrac{3}{2}$ 回
  • 例2において,サイコロを投げる回数の期待値は $6$ 回
  • 例3において,初ヒットまでにかかる打席数の期待値は $\dfrac{10}{3}$

注:あくまで期待値の話です。巨人のセペダのように初ヒットがなかなか出ない選手もいます。


(期待値の導出)
幾何分布の期待値は,期待値の定義より $\displaystyle\sum_{n=1}^{\infty}np(1-p)^{n-1}$ である。
これは等比×等差の和なので等比×等差の和を求める2通りの方法のいずれの方法でも計算できる。

なお,期待値の意味を考えて $E=p+(1-p)(E+1)$ という漸化式を立てて一発で導出することもできる。

分散の導出も同様です。

幾何分布の無記憶性

幾何分布は無記憶性を持ちます。大雑把に言うと過去の結果からは何も分からないという意味です。

(いずれも幾何分布に従うという仮定のもと)

  • じゃんけんで3回もあいこが続いたから次もあいこになりそう,というのは勘違い。
  • 25打席ノーヒットだから次も凡退しそう,というのは勘違い。

なお,幾何分布の連続バージョンが指数分布です(幾何分布において試行回数を増やしていき,そのぶん成功確率を0に近づけるような極限を適切に取ると指数分布になる)。→指数分布の意味と具体例

「運を使いきってしまった」とか言う人には「無記憶性があるから大丈夫だよ」と励ましてあげるとよいでしょう。

Tag: いろいろな確率分布の平均,分散,特性関数などまとめ

分野: データの分析,確率  レベル: 最難関大学