資料のちらばりを表す

いくつかの集団を比べる方法にはどのようなものがあるだろうか。

下の表は、ある地区の30世帯が1年間で炭酸飲料と乳酸菌飲料を購入した金額です。
どのような特徴があるでしょうか。

炭酸飲料の購入金額(円)
13965 23930 33993 43920 54052 63896 74065 83878 94098 104086
113866 123798 134135 143765 154198 163656 174291 183605 194689 203201
213980 223840 234135 243546 254302 263120 274703 283605 290 303458
乳酸菌飲料の購入金額(円)
14156 24069 34198 43976 54201 63852 74231 83724 94351 104286
113601 123502 134420 143325 154533 163201 174602 183105 194701 203002
213659 223698 234231 243580 254350 26128 273798 284231 294367 304498

セリフ

炭酸飲料と乳酸菌飲料
とではどちらを多く購入
しているのか比べてみよう。

(1)
それぞれの世帯の飲料の購入金額の合計を
比べてみましょう。
(2)
それぞれの購入金額の平均をだして
比べてみましょう。
(3)
購入金額のちらばりの様子を比べてみましょう。

 炭酸飲料と乳酸菌飲料の購入について、全体のちらばりの様子を表に整理してみましょう。

度数分布表
 記録をいくつかの区間に分け、それぞれの区間に入る記録の数を数える表を、「度数分布表」といいます。
 度数分布表にすると、データのちらばりの様子をわかりやすく表すことができます。

階級:
記録の区間(データをまとめる範囲)
度数:
階級の区間に入る記録の数(個数)
度数分布表:
資料をいくつかの階級にわけ、階級ごとに度数を表すことでデータのちらばりの様子をわかりやすくした表

 購入した金額を100円ずつにくぎって度数分布表に整理してみると、以下の表のようになります。

炭酸飲料の購入
階級:金額 度数:世帯数
2900円以上~3000円未満0
3000~31000
3100~32001
3200~33001
3300~34000
3400~35001
3500~36001
3600~37003
3700~38002
3800~39004
3900~40005
4000~41004
4100~42003
4200~43001
4300~44001
4400~45000
4500~46000
4600~47001
4700~48001
4800~49000
合 計29
※30世帯調べ 表は29の値 内一つは外れ値
乳酸菌飲料の購入
階級:金額 度数:世帯数
2900円以上~3000円未満0
3000~31001
3100~32001
3200~33001
3300~34001
3400~35000
3500~36002
3600~37003
3700~38002
3800~39001
3900~40001
4000~41001
4100~42002
4200~43005
4300~44003
4400~45002
4500~46001
4600~47001
4700~48001
4800~49000
合 計29
※30世帯調べ 表は29の値 内一つは外れ値

 炭酸飲料の購入金額が0円、乳酸菌飲料の購入金額が128円の家庭は、他の世帯の購入金額がどちらの飲料も3000円以上なのに対して金額に大きな違いがあることがわかります。

 このように、他の多数のデータから大きく離れている範囲外の値のことを「外れ値」といいます。
 「外れ値」は平均を求めるときに、影響をあたえることもあります。

 ちらばりの様子を表にしてみると、合計や平均だけではわからなかった特徴がわかります。

次へ