最終更新:2019/07/06

ベータ分布の意味と平均・分散の導出


ベータ分布とは,確率密度関数が $f(x)=Cx^{a-1}(1-x)^{b-1}\:(0\leq x\leq 1)$ であるような確率分布のことです。

ただし,$a,b$ はパラメータ(正の実数)であり,$C$ は規格化定数です。

ベータ分布の意味

ベータ分布は「コイン投げにおける表が出る確率の予測分布」という解釈ができます。

表が出る確率 $x$ が不明であるコインを何回か投げて,表が $m$ 回,裏が $n$ 回出たとします。このとき「表が出る確率の予測値」は,パラメータが $(a,b)=(m+1,n+1)$ であるベータ分布に従うと考えることができます(→注)。

いろいろなベータ分布の図

例えば,
$(a,b)=(1,1)$ のときは,ベータ分布は青い直線のように一様分布になります。つまり,$m=n=0$ のとき(そもそもコインを投げていないとき)は「情報が全く無いので,$x$ は一様分布に従う」と解釈できます。

$(a,b)=(2,3)$ のときは,ベータ分布は赤い曲線のようになります。つまり,$m=1,n=2$ のときは「表が出る確率は $\dfrac{1}{3}$ に近そうだけど,試行回数が少ないので,$\dfrac{1}{3}$ からは遠い値かもしれない」と解釈できます。

$(a,b)=(4,7)$ のときは,ベータ分布は緑の曲線のようになります。つまり,$m=3,n=6$ のときは「表が出る確率は $\dfrac{1}{3}$ に近そうで,先ほどより試行回数が多いので,より自信を持って $\dfrac{1}{3}$ に近いと言える」と解釈できます。

注:上記は大雑把な説明です。より正確に言うと,事前分布を一様分布とし,尤度が二項分布(コイン投げ)であるときの事後分析がベータ分布になります。

ベータ分布のパラメータ

ベータ分布は,$a,b$ という2つのパラメータを持っています。$a,b$ の値によって分布の形は大きく異なります。Wolfram Alphaでbetadistribution[a,b]と入力すればパラメータが $a,b$ のベータ分布の確率密度関数のグラフを見ることができます。 $a$ や $b$ をいろいろな値にして図示してみると楽しいです。

例えば,$a=b$ の場合,確率密度関数は $x=\dfrac{1}{2}$ に関して対称になります。

ベータ分布の規格化定数

ベータ分布の確率密度関数
$f(x)=Cx^{a-1}(1-x)^{b-1}$
における $C$ は規格化定数です。

$C=\dfrac{1}{\int_0^1x^{a-1}(1-x)^{b-1}dx}$
です。

ベータ関数を使うと,$C=\dfrac{1}{B(a,b)}$ と表すことができます。また,$a,b$ が整数のとき,
$C=\dfrac{(a+b-1)!}{(a-1)!(b-1)!}$ となります。

ベータ分布の平均

ベータ分布の平均は $E[X]=\dfrac{a}{a+b}$ です。これは綺麗なので覚えておいてもよいでしょう。

証明

平均は,
$\displaystyle\int_0^1 xf(x)dx\\
=\dfrac{\int_0^1x^a(1-x)^{b-1}dx}{\int_0^1x^{a-1}(1-x)^{b-1}dx}$

ここで,分母分子はそれぞれベータ関数の積分公式:$\displaystyle\int_0^1x^m(1-x)^n=\dfrac{m!n!}{(m+n+1)!}$ を用いて計算できるので,上式は
$\dfrac{a!(b-1)!}{(a+b)!}\cdot \dfrac{(a+b-1)!}{(a-1)!(b-1)!}\\
=\dfrac{a}{a+b}$
となる。

ベータ分布の分散

ベータ分布の分散は $V[X]=\dfrac{ab}{(a+b)^2(a+b+1)}$ です。これは覚える必要はありません。

証明

分散は,
$E[X^2]-E[X]^2\\
=\dfrac{\int_0^1x^{a+1}(1-x)^{b-1}dx}{\int_0^1x^{a-1}(1-x)^{b-1}dx}-\dfrac{a^2}{(a+b)^2}$

第一項は先ほどと同様にベータ関数の積分公式を用いて計算できる。上式は,
$\dfrac{(a+1)!(b-1)!}{(a+b+1)!}\cdot\dfrac{(a+b-1)!}{(a-1)!(b-1)!}-\dfrac{a^2}{(a+b)^2}\\
=\dfrac{a(a+1)}{(a+b)(a+b+1)}-\dfrac{a^2}{(a+b)^2}\\
=\dfrac{a(a+1)(a+b)-a^2(a+b+1)}{(a+b^2)(a+b+1)}\\
=\dfrac{ab}{(a+b)^2(a+b+1)}$
となる。

有名な確率分布は全て記事にしたいです!

Tag: いろいろな確率分布の平均,分散,特性関数などまとめ