2015/11/25

標準偏差の意味と分散との違い

分野: データの分析,確率  レベル: 基本公式

標準偏差 $\sigma$ はデータの散らばり具合を表す指標の一つ。データを $x_1,x_2,\cdots ,x_n$ とすると
$\sigma=\sqrt{\dfrac{1}{n}\displaystyle\sum_{i=1}^n(x_i-\mu)^2}$

ただし,$\mu$ はデータの平均です。

計算例

例題

受験者5人の数学のテストの点数がそれぞれ$(50,60,70,70,100)$ であった。標準偏差を求めよ。

解答

まず平均を求める必要がある:$\mu=\dfrac{50+60+70+70+100}{5}=70$
あとは,標準偏差の定義より
$\sigma=\sqrt{\dfrac{1}{5}\{(50-70)^2+(60-70)^2+(70-100)^2\}}\\
=\sqrt{\dfrac{1}{5}(400+100+900)}\fallingdotseq 16.7$

標準偏差の意味

標準偏差はデータの散らばり具合を表す指標です。
標準偏差が大きい→平均 $\mu$ から遠く離れたデータが多い→散らばり大
標準偏差が小さい→平均 $\mu$ に近いデータが多い→散らばり小
と解釈できます。

例えば先ほどの例題の標準偏差は $16.7$ でしたが,テストの点数が$(65,70,70,70,75)$ の場合は標準偏差は $\sqrt{\dfrac{25+25}{5}}\fallingdotseq 3.16$ となり,確かに点数が散らばっている方が標準偏差が大きいです。

分散との関係

データの散らばり具合を表す指標としては分散もポピュラーです。→分散の意味と二通りの計算方法

標準偏差の二乗=分散なので標準偏差か分散のどちらか一方を保持しておけばもう片方はすぐに分かります。

標準偏差のよいところ

標準偏差は単位の次元がデータと同じなので,現実のデータの散らばり具合を表現する際には標準偏差が用いられることが多い気がします。例えば先ほどの例題について強引に単位をつけるとすると,標準偏差は $\sigma=16.7$(点),分散は $\sigma^2=280$(点${}^2$)となります。

偏差値の計算にも標準偏差が登場します。→偏差値の計算方法と様々な性質

分散のよいところ

確率分布の散らばり具合を表すのには分散が用いられることが多いです。分散は「平均まわりの二次モーメント」であり,数学的な主張を(標準偏差を使う場合よりも)美しく記述できるからだと思います。

注:「確率分布に対する標準偏差」は「確率分布に対する分散の正の平方根」で定義します。

平均点が同じ70点でも,標準偏差が小さいときの方が100点の価値は高くなります。

Tag:数学1の教科書に載っている公式の解説一覧

分野: データの分析,確率  レベル: 基本公式