最終更新:2019/07/15

箱ひげ図の意味

分野: データの分析,確率  レベル: 基本公式

箱ひげ図の意味

箱ひげ図とは,図のように「最大値・最小値・四分位数」の情報を表現したグラフです。箱ひげ図には平均値の情報が含まれることもあります。

箱ひげ図を見れば,データの分布を大雑把に把握することができます。

箱ひげ図の意味

箱ひげ図では,長方形(はこ)と線(ひげ)を使って「最大値・最小値・四分位数」の情報を表現します。

箱とひげ

真ん中の長方形(はこ)は,四分位数を表します。つまり,

  • 箱の下側が,第1四分位数(下から1/4の部分にあるデータの値)
  • 箱の真ん中の横線が,第2四分位数(中央値,ちょうど真ん中にあるデータの値)
  • 箱の上側が,第3四分位数(上から1/4の部分にあるデータの値)

を表します。

また,上下のひげは,最大値と最小値の情報を表します。

さらに,平均値をバツ印で表現することもあります。

箱ひげ図のメリット

箱ひげ図を使うと,データの情報を簡潔に表現することができます。

箱ひげ図の例

例えば「ある地域の年収は,最大1000万,最小200万,第1四分位数は300万,中央値は500万,第3四分位数は750万」のように文章で表現するよりも,箱ひげ図を使った方が分かりやすいです。

箱の部分を見ることで「真ん中半分の人は300万から750万」ということもすぐに分かります。

箱ひげ図に関する注意

箱ひげ図の読み方
  • 箱ひげ図は,図のように横向きに書くこともあります。
  • 上記で説明したのは高校数学の教科書に載っている「外れ値を考慮しないバージョン」です。外れ値を考慮した箱ひげ図(こちらの方が一般的だと思います)については後述します。
  • 箱ひげ図には,バツ印(平均値)を書かないこともあります。
  • 第1四分位数とはデータの中で小さい方から $\dfrac{1}{4}$,第3四分位数とはデータの中で大きい方から $\dfrac{1}{4}$ にある数です。四分位数の求め方にはいくつか流儀があるので注意が必要です。→四分位数の求め方といろいろな例題

外れ値を考慮した箱ひげ図

外れ値を考慮した箱ひげ図

中央値,四分位数は外れ値に引っ張られませんが,最大値,最小値は外れ値に引っ張られます。つまり,教科書の箱ひげ図の定義の場合「箱」は外れ値に引っ張られませんが「ひげ」は外れ値に引っ張られます。

そこで「外れ値を考慮する立場」では,上下のひげはともに箱の1.5倍以下の長さとして,もしそれを越えるようなデータがある場合は外れ値とみなす(最大・最小値とはみなさない,ひげはそこまで伸ばさない)ことにします。

都合の悪い実験データを外れ値として意図的に隠すのはやってはいけませんよ!

Tag: 数学1の教科書に載っている公式の解説一覧