2015/08/27

p値の意味と具体例


統計量(確率変数)がデータから計算した統計量の値より極端な値を取る確率をp値と言う。
p値が小さい→帰無仮説が正しくなさそう。

p値の意味,具体例(カイ二乗分布)について説明します。

p値とは

  • p値(p-value,有意確率)は統計学的仮説検定(→統計学的仮説検定の考え方と手順)における重要な概念です。
  • 帰無仮説 $H_0$ のもとで,統計量(確率変数)$T$ が,データから実際に計算した統計量の値 $T_0$ よりも「極端」な値を取る確率をp値と言います(「極端」の意味は両側検定か片側検定かによって変わります,後述の具体例も参照)。

p値の意味,必要性

仮説検定の結果は「有意水準が5%で帰無仮説を棄却」という感じになりますが,じゃあもっと厳し目に見て,有意水準1%や0.1%ではどうなるのか?その限界はいくらなのか?という疑問が出てきます。その疑問を解決するのがp値です。

p値と有意水準の定義より,
p値 $<$ 有意水準 $\iff$ 帰無仮説を棄却
となります。

つまり,帰無仮説が棄却されるような有意水準の限界値がp値です。

以下のように説明することもできます。
p値が小さい
→データから計算した統計量 $T_0$ よりも極端な値を取る確率が小さい
→帰無仮説のもとでは観測したデータは異常
→帰無仮説を棄却

p値が小さければ小さいほど安心して帰無仮説を棄却できるということです。

カイ二乗分布,片側検定の例

例題

正規母集団から無作為に抽出した大きさ $20$ の標本について,その偏差二乗和は $35$ であった。
母分散が $1.0$ より小さいかどうか検定したい。p値を求めよ。

解答

帰無仮説は $\sigma^2=1.0$,対立仮説は $\sigma^2 < 1.0$ とし片側検定を行う。
統計量は(帰無仮説のもと),$\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n(X_i-\overline{X})^2=\dfrac{35}{1.0}=35$ であり,これが自由度 $20-1=19$ のカイ二乗分布に従う(→不偏分散と自由度n-1のカイ二乗分布

よって求めるp値は,自由度 $19$ のカイ二乗分布に従う確率変数 $T$ が $35$ よりも「極端」(=この場合対立仮説が $\sigma^2 < 1.0$ なので「大きい」)な値を取る確率である。実際に計算すると,p値 $\simeq 0.0140$ となる。

つまり,有意水準 $5$ %なら帰無仮説は棄却,有意水準 $1$ %だと採択される。

p値の厳密な定義は統計の本を参照して下さい。

確率・統計分野の記事一覧