箱ひげ図で、外れ値の書き方(検出)
普通の箱ひげ図は、
1, 最大値
2, 第三四分位
3, 第二四分位
4, 第一四分位
5, 最小値
を使う
外れ値ありの箱ひげ図では、
1, 最大値の代わりに(第三四分位+1.5×四分位範囲)より小さい中での最大値を採用
2, 第三四分位
3, 第二四分位
4, 第一四分位
5, 最小値の代わりに(第一四分位-1.5×四分位範囲)より大きい中での最小値を採用
以下のようなデータがあったら、普通の箱ひげ図では
20 ← 最大値(上ヒゲ)
10
9 ← 第三四分位(箱の上辺)
8
7
6 ← 第二四分位(中央値、箱の中線)
5
4
3 ← 第一四分位(箱の下辺)
2
1 ← 最小値(下ヒゲ)
外れ値検出のある箱ひげ図の場合
IQRが9-3=6だから
上ヒゲ = 9 + 1.5×6 = 18未満の最大値を採用(10)
下ヒゲ = 3 – 1.5×6 = -9超えの最小値を採用(1)
20 ← 上ヒゲ以上なので外れ値
10 ← 上ヒゲ(第三四分位+1.5×四分位範囲)より小さい中での最大値を採用
9 ← 第三四分位(箱の上辺)
8
7
6 ← 第二四分位(中央値、箱の中線)
5
4
3 ← 第一四分位(箱の下辺)
2
1 ← 下ヒゲ(第一四分位-1.5×四分位範囲)より大きい中での最小値を採用
エクセルで箱ひげ図を書いてみた。最大値の20を18に変更すると、外れ値じゃなくなるから、18未満じゃなくて18以下なのか?