2014/11/18

二項分布の平均と分散の二通りの証明

分野: データの分析,確率  レベル: 最難関大学

  • 確率 $p$ で当たるような試行を(独立に)$n$ 回繰り返す。そのうち $k$ 回当たる確率は,${}_n\mathrm{C}_kp^k(1-p)^{n-k}$ である。
  • 二項分布 $\mathrm{B}(n,p)$ に従う確率変数の期待値は $np$,分散は $np(1-p)$ である。

二項分布について

  • 高校数学では「反復試行の確率」などとも呼ばれる頻出のテーマです。→反復試行の確率の公式といろいろな例題
  • 当たる回数 $X$ は確率変数であり,$P(X=k)={}_n\mathrm{C}_kp^k(1-p)^{n-k}$ を満たします。この $X$ が従う確率分布を二項分布と言い,$\mathrm{B}(n,p)$ や $\mathrm{Bin}(n,p)$ と書きます。
  • より美しくして式を扱いやすくするために $q=1-p$ とおくことがあります。 $P(X=k)={}_n\mathrm{C}_kp^kq^{n-k}$ となります。

サイコロで5以上の目が出たら勝ちというゲームを5回行うときちょうど3回勝つ確率を求めよ。

解答

サイコロで5以上の目が出る確率は $p=\dfrac{1}{3}$ である。よって,$3$ 回勝つ確率は,${}_{5}\mathrm{C}_3(\dfrac{1}{3})^3(\dfrac{2}{3})^2=\dfrac{40}{243}$

3回勝つ確率は結構低いです。では平均で何回くらい勝つのか?というのが気になりますね。そこで二項分布の期待値です。

二項分布の期待値

二項分布 $\mathrm{B}(n,p)$ に従う確率変数 $X$ の期待値は $E[X]=np$ である。

つまり,平均で $np$ 回勝つということです。上記の例だと,期待値は $\dfrac{5}{3}$ となります。

これは,期待値の線形性を知っていれば簡単に証明できます。→和の期待値は期待値の和

(期待値の証明1)
$i$ 回目に当たったときに $1$,当たらないときに $0$ を取る確率変数を $X_i$ とおくと,
$X=X_1+X_2+\cdots +X_n$ であり,期待値の線形性から
$E[X]=E[X_1]+E[X_2]+\cdots +E[X_n]$
右辺の各項はいずれも当たる確率 $p$ と等しいので $E[X]=np$ となる。

二項分布の期待値の計算による証明

期待値の線形性を使った先ほどの方法はエレガントで直感的にも分かりやすいですが,期待値の定義に従ってゴリゴリ計算する方法も解説しておきます。二項定理とシグマ計算のよい練習問題です。

(期待値の証明2)
期待値の定義より,
$E[X]=\displaystyle\sum_{k=0}^nkP(X=k)\\
=\displaystyle\sum_{k=1}^nk{}_n\mathrm{C}_kp^kq^{n-k}\\
=n\displaystyle\sum_{k=1}^n{}_{n-1}\mathrm{C}_{k-1}p^kq^{n-k}$
ただし,最後の変形では二項係数の有名公式の公式3を用いた。

これは$(p+q)$ のべき乗の展開っぽいので二項定理が使えそう。このことに注意してさらに計算すると,
$E[X]=np\displaystyle\sum_{k=1}^n{}_{n-1}\mathrm{C}_{k-1}p^{k-1}q^{n-k}\\
=np\displaystyle\sum_{k=0}^{n-1}{}_{n-1}\mathrm{C}_{k}p^{k}q^{n-1-k}\\
=np(p+q)^{n-1}\\
=np$

期待値の次は分散です!

二項分布の分散

二項分布 $\mathrm{B}(n,p)$ に従う確率変数 $X$ の分散は $V[X]=np(1-p)=npq$ である。

こちらも二通りの方法で証明しておきます。

独立な確率変数の和の分散は分散の和に分解できます。→期待値と分散に関する公式一覧の公式7。

(分散の証明1)
期待値の場合と同様に,$V[X]=V[X_1]+V[X_2]+\cdots +V[X_n]=nV[X_1]$ となるので $V[X_1]$ を計算すればよい。これは分散の定義から,$p(1-p)^2+(1-p)p^2=p(1-p)=pq$ となる。

二項分布の分散の計算による証明

期待値と分散に関する公式一覧の公式8:$V[X]=E[X^2]-E[X]^2$ を用いて分散を計算します。 $E[X]$ は先ほど求めたので,$E[X^2]$ を同様に求めればOKです。

(分散の証明2)
$E[X^2]=\displaystyle\sum_{k=0}^nk^2P(X=k)\\
=\displaystyle\sum_{k=1}^nk(k-1){}_n\mathrm{C}_kp^kq^{n-k}+\sum_{k=1}^nk{}_n\mathrm{C}_kp^kq^{n-k}\\
=n(n-1)\displaystyle\sum_{k=2}^n{}_{n-2}\mathrm{C}_{k-2}p^kq^{n-k}+E[X]\\
=n(n-1)p^2\displaystyle\sum_{k=2}^n{}_{n-2}\mathrm{C}_{k-2}p^{k-2}q^{n-k}+np\\
=n(n-1)p^2\displaystyle\sum_{k=0}^{n-2}{}_{n-2}\mathrm{C}_{k}p^{k}q^{n-k-2}+np\\
=n(n-1)p^2(p+q)^{n-2}+np\\
=n(n-1)p^2+np$
よって,$V[X]=E[X^2]-E[X]^2=np-np^2=npq$

なお,モーメント母関数を用いる方法もあります。→モーメント母関数の意味と具体的な計算例

成功確率が1割でも(独立なら)10回やれば1回くらい成功します。下手な鉄砲も数打ちゃ当たる。

Tag: いろいろな確率分布の平均,分散,特性関数などまとめ
Tag: 数学Bの教科書に載っている公式の解説一覧

分野: データの分析,確率  レベル: 最難関大学