度数分布
度数分布とは、データの大まかな分布(全体像)を掴むために、データを特定の範囲に分割し、それぞれの範囲に当てはまるデータの個数(度数)を見る手法です。
このような手法によってデータをまとめた表のことを「度数分布表」と言い、活用することでデータの特徴や分布状況を把握しやすくすることができます。
度数分布表からは平均値、中央値、最頻値、標準偏差などデータの特徴を表す値を求めることができます。
例えば、健康診断である会社の社員全員の身長を測定したとします。
その記録を見ただけでは全体の特徴を把握することは難しいですが、身長の範囲を155~160cm、160~165cmというようにいくつかの小範囲に分けて、各小範囲に属する人数を数えて表にすると、身長の分布状態が非常に見やすいものになります。
この分けられた小範囲を「階級」と言い、この階級に属するデータの個数(この例の場合は人数)をその階級の「度数」と言います。
各階級(身長)にその度数(人数)を対応させたものが度数分布で、それを表の形にしたものが度数分布表です。
度数分布表と同じく、データの分布や特徴を把握するための手法として「ヒストグラム」がありますが、違いは「表かグラフか」であり、どこまで詳細に情報を知りたいかによって使い分ける必要性があります。
度数分布表はその名の通り、詳細なデータの特徴を掴むために表で表示されます。
ヒストグラムは、データを視覚的に把握できるようにするために情報を絞り、グラフ化して表示しています。
度数分布表を作成する場合は、Frequency関数やグラフの作成機能を活用するといいでしょう。