2015/04/17

正規分布の二乗和がカイ二乗分布に従うことの証明


定理(カイ二乗分布と正規分布の関係):
確率変数 $X_1,X_2,\cdots,X_n$ が互いに独立に標準正規分布 $N(0,1)$ に従うとき,$X=X_1^2+X_2^2+\cdots +X_n^2$ は自由度 $n$ のカイ二乗分布に従う。


注:標準正規分布とは平均 $0$,分散 $1$ の正規分布です。→正規分布の標準化の意味と証明

カイ二乗分布とは

・自由度 $n$ のカイ二乗分布とは,以下の確率密度関数で表される分布です:
$f_n(x)=\dfrac{1}{2^{\frac{n}{2}}\Gamma(\frac{n}{2})}x^{\frac{n}{2}-1}e^{-\frac{x}{2}}\:(x > 0)$

ただし,$\Gamma(\frac{n}{2})$ はガンマ関数です。→ガンマ関数(階乗の一般化)の定義と性質

自由度2のカイ二乗分布の確率密度関数は $\Gamma(1)=1$ より
$f_2(x)=\dfrac{1}{2}e^{-\frac{x}{2}}\:(x > 0)$

  • 一見複雑ですが,カイ二乗分布の形を決める重要な部分は $x^{\frac{n}{2}-1}e^{-\frac{x}{2}}$ のみです。 $\dfrac{1}{2^{\frac{n}{2}}\Gamma(\frac{n}{2})}$ はただの正規化定数です(確率密度関数なので全区間で積分して1になる必要がある)。
  • (確率密度関数なので当然ですが)$\displaystyle\lim_{x\to\infty}f_n(x)=0$ です。
  • 自由度 $n$ のカイ二乗分布の平均は $n$,分散は $2n$ です。
  • カイ二乗分布は適合度の検定,独立性の検定などにも登場する非常に重要な分布です。

自由度1の場合

以下では冒頭の定理:「独立な標準正規分布の二乗和はカイ二乗分布に従う」を証明します。数理統計をやるなら一度はやっておきたい計算です。

帰納法で証明するために,まずは $n=1$ の場合を計算します。

$X$ が標準正規分布に従うとき,$X^2$ は自由度1のカイ二乗分布に従う

証明

標準正規分布の確率密度関数は,$f(x)=\dfrac{1}{\sqrt{2\pi}}\exp (-\dfrac{x^2}{2})$

ここで,$y=x^2$ と変数変換すると,$\dfrac{dy}{dx}=2x=2\sqrt{y}$ であるので $X^2$ の従う確率密度関数は,
$f_1(y)=2\times \dfrac{1}{\sqrt{2\pi}}\exp (-\dfrac{y}{2})\dfrac{1}{2\sqrt{y}}$
(ただし,$Y=y$ となるのは $X=\sqrt{y},-\sqrt{y}$ の二通りあるので頭に2倍がついている)
$=\dfrac{1}{2^{\frac{1}{2}}\sqrt{\pi}}y^{-\frac{1}{2}}\exp(-\dfrac{y}{2})$

となる。 $\Gamma(\dfrac{1}{2})=\sqrt{\pi}$ であり,これは自由度1のカイ二乗分布を表す。

一般の自由度の場合

帰納法を用います。畳み込みの計算をするだけです!

証明

$Y=X_1^2+\cdots +X_{n-1}^2$ が自由度 $n-1$ のカイ二乗分布に従い,$X_n^2$ が自由度1のカイ二乗分布に従うとき,$Y+X_n^2$ が自由度 $n$ のカイ二乗分布に従うことを示せばよい。

つまり,以下を証明すればよい:
$f_n(x)=\displaystyle\int_0^xf_{n-1}(t)\:f_1(x-t)dt$

右辺を書き下してみると,指数関数部分が積分の外に出せる:
$\dfrac{e^{-\frac{x}{2}}}{2^{\frac{n}{2}}\Gamma(\frac{n-1}{2})\sqrt{\pi}}\int_0^xt^{\frac{n-3}{2}}(x-t)^{-\frac{1}{2}}dt$

ここで $x=tu$ と変数変換すると $x$ が積分の外に出せる:
$\dfrac{e^{-\frac{x}{2}}x^{\frac{n-3}{2}-\frac{1}{2}+1}}{2^{\frac{n}{2}}\Gamma(\frac{n-1}{2})\Gamma(\frac{1}{2})}\int_0^1u^{\frac{n-3}{2}}(1-u)^{-\frac{1}{2}}du$

積分の部分はベータ関数の積分公式より $B(\frac{n-1}{2},\frac{1}{2})=\dfrac{\Gamma(\frac{n-1}{2})\Gamma(\frac{1}{2})}{\Gamma(\frac{n}{2})}$

よって,$\Gamma(\frac{n-1}{2})\Gamma(\frac{1}{2})$ が約分されて自由度 $n$ のカイ二乗分布の確率密度関数と一致する。

最後約分される瞬間がたまりませんね。

Tag: いろいろな確率分布の平均,分散,特性関数などまとめ