2015/10/16

ベータ分布の意味と平均・分散の導出


確率密度関数が $f(x)=Cx^{a-1}(1-x)^{b-1}\:(0\leq x\leq 1)$ であるような確率分布をベータ分布と言う。

ただし,$a,b$ はパラメータ(正の実数)であり,$C=\dfrac{1}{\int_0^1x^{a-1}(1-x)^{b-1}dx}$ は規格化定数。

ベータ分布について

例えば(やや専門的ですが)ベイズ統計学において二項分布の共役事前分布として登場する有名な分布です。

$a,b$ の値によって分布の形は大きく異なります。Wolfram Alphaでbetadistribution[a,b]と入力すればパラメータが $a,b$ のベータ分布の確率密度関数のグラフを見ることができます。 $a$ や $b$ をいろいろな値にして図示してみると楽しいです。

なお,$a=b=1$ の場合,$f(x)=1\:(0\leq x\leq 1)$ となり区間 $[0,1]$ 上の一様分布になります。

また,$a=b$ の場合,確率密度関数は $x=\dfrac{1}{2}$ に関して対称になります。

ベータ分布の平均

ベータ分布の平均は $E[X]=\dfrac{a}{a+b}$ です。これは綺麗なので覚えておいてもよいでしょう。

証明

平均は,
$\displaystyle\int_0^1 xf(x)dx\\
=\dfrac{\int_0^1x^a(1-x)^{b-1}dx}{\int_0^1x^{a-1}(1-x)^{b-1}dx}$

ここで,分母分子はそれぞれベータ関数の積分公式:$\displaystyle\int_0^1x^m(1-x)^n=\dfrac{m!n!}{(m+n+1)!}$ を用いて計算できるので,上式は
$\dfrac{a!(b-1)!}{(a+b)!}\cdot \dfrac{(a+b-1)!}{(a-1)!(b-1)!}\\
=\dfrac{a}{a+b}$
となる。

ベータ分布の分散

ベータ分布の分散は $V[X]=\dfrac{ab}{(a+b)^2(a+b+1)}$ です。これは覚える必要はありません。

証明

分散は,
$E[X^2]-E[X]^2\\
=\dfrac{\int_0^1x^{a+1}(1-x)^{b-1}dx}{\int_0^1x^{a-1}(1-x)^{b-1}dx}-\dfrac{a^2}{(a+b)^2}$

第一項は先ほどと同様にベータ関数の積分公式を用いて計算できる。上式は,
$\dfrac{(a+1)!(b-1)!}{(a+b+1)!}\cdot\dfrac{(a+b-1)!}{(a-1)!(b-1)!}-\dfrac{a^2}{(a+b)^2}\\
=\dfrac{a(a+1)}{(a+b)(a+b+1)}-\dfrac{a^2}{(a+b)^2}\\
=\dfrac{a(a+1)(a+b)-a^2(a+b+1)}{(a+b^2)(a+b+1)}\\
=\dfrac{ab}{(a+b)^2(a+b+1)}$
となる。

有名な確率分布は全て記事にしたいです!

Tag: いろいろな確率分布の平均,分散,特性関数などまとめ