2015/03/06

正規分布の標準化の意味と証明


定理1(正規分布の一次式):
$X$ が正規分布に従うとき,$aX+b$ も正規分布に従う。
(ただし $a,b$ は任意の実数で $a\neq 0$)

(証明は最後にやります)
この定理の応用として正規分布の標準化について解説します。

なお,正規分布についての簡単な知識は正規分布の基礎的なことをどうぞ。

平均と分散

$X$ が平均 $\mu$,分散 $\sigma^2$ の正規分布に従うとき,$X \sim N(\mu,\sigma^2)$ と書くことにします。

$E[aX+b]=aE[X]+b,\:V[aX+b]=a^2V[X]$ であることに注意すると,定理1は以下のように強めることができます:

定理2:
$X\sim N(\mu,\sigma^2)$ ならば $aX+b\sim N(a\mu+b,a^2\sigma^2)$

このように定理2は定理1からすぐに導けるので,定理1だけ覚えておけばOKです。

正規分布の標準化

正規分布の中でも平均が0,分散が1であるものを標準正規分布と言います。

正規分布に従う確率変数 $X$ に対して,$aX+b$ が標準正規分布に従うように $a,b$ を定めることができます。

定理3(標準化):
$X\sim N(\mu,\sigma^2)$ ならば $\dfrac{X-\mu}{\sigma}\sim N(0,1)$
つまり,正規分布に従う確率変数は適切に定数倍&平行移動することで標準正規分布に従う確率変数を作れる。

定理2において $a=\dfrac{1}{\sigma},b=-\dfrac{\mu}{\sigma}$ としただけですが,定理3はよく使うので覚えておいてもよいでしょう。

正規分布の標準化の嬉しさ

$X$ が正規分布に従うとき,標準化&標準正規分布表を用いることで $P(a\leq X\leq b)$ を求めることができます!

$X$ が平均 $1$,分散 $9$ の正規分布に従うとき,$X$ が $4$ 以上 $10$ 以下となる確率を求めよ。ただし,標準正規分布表は与えられているとする。

解答

$X\sim N(1,9)$ より,定理3を使うと $\dfrac{X-1}{3}\sim N(0,1)$
また,$4\leq X\leq 10\iff 1\leq \dfrac{X-1}{3}\leq 3$
なので,求める確率は $P(1\leq \dfrac{X-1}{3}\leq 3)$
これは標準正規分布表を使って求めることができる!
実際求めると $0.157$ くらいになる。


正規分布は「(平行移動,定数倍で一致するのは同じものとみなすと)1種類しかない」ので全ての正規分布に対して表を用意しておかなくても標準正規分布表だけ用意しておけばどんな正規分布に対しても使えるという訳です。

定理2の証明

定理2を二通りの方法で証明します(定理2は定理1よりもやや強いので定理1の証明も含んでいます)。

証明1:確率密度関数を用いる素直な方法(確率密度関数の変数変換が必要)

証明

$X\sim N(\mu,\sigma^2)$ のとき,確率密度関数は
$f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\exp (-\dfrac{(x-\mu)^2}{2\sigma^2})$

目標は,$Y=aX+b$ の従う確率密度関数 $g(y)$ を求めること。
そこで,$y=ax+b$ と変数変換すると,$g(y)=f(x)\dfrac{dx}{dy}$ なので
$g(y)=\dfrac{1}{\sqrt{2\pi}\sigma}\exp \left[-\dfrac{((\frac{y-b}{a})-\mu)^2}{2\sigma^2}\right]\cdot\dfrac{1}{a}\\
=\dfrac{1}{\sqrt{2\pi}a\sigma}\exp \left[-\dfrac{((y-(a\mu+b))^2}{2(a\sigma)^2}\right]$
これは平均 $a\mu+b$,分散 $a^2\sigma^2$ の正規分布の確率密度関数である。


証明2:特性関数を用いる方法(正規分布の特性関数が必要)

証明

$X$ の特性関数は,
$\phi_X(t)=\exp\left[i\mu t-\dfrac{\sigma^2t^2}{2}\right]$
よって,$aX+b$ の特性関数は,
$\phi_{aX+b}(t)=E[e^{itaX}e^{itb}]\\
=e^{itb}E[e^{itaX}]\\
=e^{itb}\phi_X(ta)\\
=\exp\left[itb+i\mu ta -\dfrac{\sigma^2t^2a^2}{2}\right]$
これは,平均 $a\mu+b$,分散 $a^2\sigma^2$ の正規分布の特性関数である。

僕は特性関数を使った証明が好きです。

Tag: 正規分布の基礎的な知識まとめ