正規分布の標準化の意味と証明

正規分布の標準化

XX が「平均 μ\mu,分散 σ2\sigma^2 の正規分布」に従うとき,
Xμσ\dfrac{X-\mu}{\sigma} は「平均 00,分散 11 の正規分布」に従う。

正規分布の標準化について,例と証明をわかりやすく説明します。

正規分布の標準化の例

  • 平均 00,分散 11 の正規分布は標準正規分布と呼ばれます。

  • どんな正規分布も,Xμσ\dfrac{X-\mu}{\sigma} という変換で,標準正規分布に変換できます。この変換を標準化と言います。

  • 標準正規分布に変換できれば,以下のようにXXaa 以上 bb 以下になる確率が計算できるので嬉しいです。

例題

XX が平均 11,分散 99 の正規分布に従うとき,XX44 以上 1010 以下となる確率を求めよ。ただし,標準正規分布表は与えられているとする。

解答

μ=1\mu=1σ2=9\sigma^2=9 であり,正規分布の標準化をすると,X13\dfrac{X-1}{3} が標準正規分布に従う。

また,4X10    1X1334\leq X\leq 10\iff 1\leq \dfrac{X-1}{3}\leq 3

なので,求める確率は P(1X133)P(1\leq \dfrac{X-1}{3}\leq 3)

これは標準正規分布表を使うと,0.1570.157 くらいであることがわかる。

全ての正規分布に対して表を用意しておかなくても,標準正規分布表だけ用意すればよいというわけです!なお,正規分布についての簡単な知識は正規分布の基礎的なことをどうぞ。

標準化について

Xμσ\dfrac{X-\mu}{\sigma} の平均が 00 で分散が 11 になることは,期待値と分散の公式を知っていれば簡単に確認できます。

平均が0で分散が1になることの確認
  • E[Xμσ]=1σ(E[X]E[μ])=1σ(μμ)=0E\left[\dfrac{X-\mu}{\sigma}\right]\\ =\dfrac{1}{\sigma}(E[X]-E[\mu])\\ =\dfrac{1}{\sigma}(\mu-\mu)\\ =0

  • V[Xμσ]=1σ2(V[X]V[μ])=1σ2(σ20)=1V\left[\dfrac{X-\mu}{\sigma}\right]\\ =\dfrac{1}{\sigma^2}(V[X]-V[\mu])\\ =\dfrac{1}{\sigma^2}(\sigma^2-0)\\ =1

  • つまり,正規分布でなくても,Y=XμσY=\dfrac{X-\mu}{\sigma} という変換(標準化)で平均を 00 に,分散を 11 にできます。
  • さらに,XX が正規分布に従うなら YY も正規分布に従う,というのがポイントです。後ほど証明します。

正規分布の標準化の証明

それでは,正規分布の標準化が正しいことを証明します。より一般に,以下の定理を証明します。

定理(正規分布の一次式の分布)

XX が正規分布に従うとき,aX+baX+b も正規分布に従う。

(ただし a,ba,b は任意の実数で a0a\neq 0

XX の平均を μ\mu,分散を σ2\sigma^2 とすると,aX+baX+b の平均は aμ+ba\mu+b,分散は a2σ2a^2\sigma^2 になります。さきほどと同じように確認できます。

この定理において a=1σ,b=μσa=\dfrac{1}{\sigma},b=-\dfrac{\mu}{\sigma} とすると標準化の式になります。

定理の証明1:確率密度関数を用いる素直な方法

確率密度関数の変数変換を使います。

証明

XN(μ,σ2)X\sim N(\mu,\sigma^2) のとき,確率密度関数は

f(x)=12πσexp{(xμ)22σ2}f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\exp \left\{-\dfrac{(x-\mu)^2}{2\sigma^2}\right\}

目標は,Y=aX+bY=aX+b の従う確率密度関数 g(y)g(y) を求めること。

そこで,y=ax+by=ax+b と変数変換すると,g(y)=f(x)dxdyg(y)=f(x)\dfrac{dx}{dy} なので

g(y)=12πσexp[((yba)μ)22σ2]1a=12πaσexp[((y(aμ+b))22(aσ)2]g(y)=\dfrac{1}{\sqrt{2\pi}\sigma}\exp \left[-\dfrac{((\frac{y-b}{a})-\mu)^2}{2\sigma^2}\right]\cdot\dfrac{1}{a}\\ =\dfrac{1}{\sqrt{2\pi}a\sigma}\exp \left[-\dfrac{((y-(a\mu+b))^2}{2(a\sigma)^2}\right]

これは平均 aμ+ba\mu+b,分散 a2σ2a^2\sigma^2 の正規分布の確率密度関数である。

正規分布の特性関数を使います。

証明

XX の特性関数は,

ϕX(t)=exp[iμtσ2t22]\phi_X(t)=\exp\left[i\mu t-\dfrac{\sigma^2t^2}{2}\right]

よって,aX+baX+b の特性関数は,

ϕaX+b(t)=E[eitaXeitb]=eitbE[eitaX]=eitbϕX(ta)=exp[itb+iμtaσ2t2a22]\phi_{aX+b}(t)=E[e^{itaX}e^{itb}]\\ =e^{itb}E[e^{itaX}]\\ =e^{itb}\phi_X(ta)\\ =\exp\left[itb+i\mu ta -\dfrac{\sigma^2t^2a^2}{2}\right]

これは,平均 aμ+ba\mu+b,分散 a2σ2a^2\sigma^2 の正規分布の特性関数である。

私は特性関数を使った証明が好きです。

Tag:正規分布の基礎的な知識まとめ