2015/08/11

母分散の推定,検定(正規分布)


平均が $\mu$,分散が $\sigma^2$ である正規分布の母分散の推定,検定:
母平均が既知→ $\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n(X_i-\mu)^2$ が自由度 $n$ のカイ二乗分布に従うことを使う。
母平均が未知→ $\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n(X_i-\overline{X})^2$ が自由度 $n-1$ のカイ二乗分に従うことを使う。

記号,問題設定

$X_1,X_2,\cdots, X_n$ はサンプル,
$\overline{X}=\dfrac{X_1+X_2+\cdots +X_n}{n}$ はサンプル平均です。

母集団が正規分布に従うことは分かっているが,その分散は分からないのでその値を推定したい(あるいはその値が $\sigma_0^2$ に等しいのか検定したい)という状況を考えます。

母平均が既知の場合

まずは,母平均 $\mu$ が分かっている場合を考えます。この場合, $\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n(X_i-\mu)^2$ が自由度 $n$ のカイ二乗分布に従うことを使います(証明は,正規分布の標準化正規分布の二乗和がカイ二乗分布に従うことの証明を組み合わせる)。

例題1(母平均既知,区間推定):期待値が $\mu$ だと分かっている正規母集団から無作為に抽出した大きさ $30$ の標本について,$\mu$ からの差の二乗和は $20.0$ であった。
母分散 $\sigma^2$ を信頼度 $90$ %で推定せよ。

解答

統計量は,$\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n(X_i-\mu)^2=\dfrac{20.0}{\sigma^2}$
自由度 $30$ のカイ二乗分布の下側 $5$ %点は $18.49$,上側 $5$ %点は $43.77$ なので $90$ %信頼区間は,
$18.49\leq\dfrac{20.0}{\sigma^2}\leq 43.77$
つまり $0.46 \leq \sigma^2\leq 1.08$

母平均が未知の場合

次に,母平均 $\mu$ も分からない場合です。この場合, $\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n(X_i-\overline{X})^2$ が自由度 $n-1$ のカイ二乗分に従うことを使います(証明は,不偏分散と自由度n-1のカイ二乗分布)。

真の平均 $\mu$ が分からないので代わりにサンプル平均 $\overline{X}$ を使ってしまおうというイメージです。

例題2(母平均未知,検定):正規母集団から無作為に抽出した大きさ $20$ の標本について,その偏差二乗和は $35$ であった。
母分散が $1.0$ と異なるかどうか,有意水準 $5$ %で検定せよ。

解答

帰無仮説は $\sigma^2=1.0$,対立仮説は $\sigma^2\neq 1.0$ とし両側検定を行う。
統計量は(帰無仮説のもと),$\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n(X_i-\overline{X})^2=\dfrac{35}{1.0}=35$

自由度 $19$ のカイ二乗分布の下側 $2.5$ %点は $8.91$,上側 $2.5$ %点は $32.85$ であり,$32.85 < 35$ なので帰無仮説は棄却される。つまり母分散は $1.0$ と異なると言える。

注:実際はデータから偏差二乗和を計算する部分も自分でやる必要があります。

実際,母分散が未知で母平均が既知という状況はあまりない気がします。