資料のちらばりを表す

代表値

 データの値(この場合はテストの成績)の一般的な傾向を表す値を代表値といいます。
 代表値には「最頻値」「中央値」「平均(平均値)」の3種類があります。

 あるクラスで行ったテストの点数の結果を以下の表にまとめました。結果をヒストグラムに表すと右図のようになります。

テストの点数
No. 点数 No. 点数
1992693
2872787
3492860
4872972
5803063
6273183
7873249
8583398
9593496
10813587
11793699
12783739
13993888
14843955
15354077
16904189
17764269
18464390
19604479
20194549
21784689
22644797
23594891
24724929
25395097

⇒

テストの点数
階級(点) 度数(人)
0以上~10未満0
10~201
20~302
30~403
40~504
50~604
60~705
70~808
80~9012
90~10011
100以上0
合 計50

⇒

テストの点数を基にしたヒストグラム
最頻値:
度数のもっとも多い階級の真ん中の値
中央値:
大きさの順に並べたときの中央の値(資料の総数が奇数の場合は、大きさの順に並べたときの中央の値、資料の総数が偶数の場合は、中央にある2つの値の平均値を中央値とする)
平均(平均値):
データ全体の合計をデータの総数で割った値
ここに注意
  • ・平均値と中央値はかならずしも一致しません。
  • ・平均値はデータの中に極端に大きい・小さい値があると影響を受けてしまうため、全体の代表的な値にならないこともあるので気をつけましょう。
  • ・「階級に分ける分け方」によって、最頻値は変わってくるので注意しましょう。
  • ・平均を求める際、外れ値(他の多数のデータから大きく離れている範囲外の値)を除外して計算する場合もあります。

箱ひげ図

 箱と箱からのびる線(=ひげ)で、ばらつきのあるデータをわかりやすく表現するための図を「箱ひげ図」といいます。
 箱ひげ図で用いられる、観測値を四等分した値を四分位数といい、測定値を小さい順に並べたとき、データ全体の小さいほうから25%の値を第1四分位数、50%の値を中央値(第2四分位数)、75%の値を第3四分位数といいます。

箱ひげ図

幹葉図(みきはず)

 「幹」とよばれる左側のけた(今回はテストの点数の十の位)と、「葉」とよばれる右側のけた(今回はテストの点数の一の位)に分けて数字を並べて、数値を見やすく示す図を「幹葉図」といいます。

幹葉図

前へ

統計を知ろう・学ぼうTOPへ