- 表紙
- まとめ
- 具体例
数学のまとめ
「データの尺度水準」とは
利用可能な統計処理かを判断できるデータの性質の区分のこと。
質的データ
数値はラベルであり,
数値自体に意味はないデータ
のこと.
量的データ
数値で定義され,
数値自体に意味があるデータ
のこと.
A. データの尺度水準
- 名義尺度:カテゴリー分けできるデータの水準である
- 順序尺度:(1)&カテゴリーに順序付けできるデータの水準である
- 間隔尺度:(2)&順序の間隔が定義でき, 等間隔であるデータの水準である
- 比例尺度:(3)&絶対零点があるデータの水準である
B. 尺度水準別のデータの演算の取り扱い
- 比例尺度は加減乗除の計算すべてに意味がある
- 間隔尺度は比例計算(乗除)の計算に意味がない
- 質的データでは四則演算のいずれも意味がない
C. 代表値・分析手法と尺度水準
- 名義尺度のデータは集計表などで整理し, 代表値は最頻値を利用する
- 順序尺度では箱ひげ図が利用でき, 代表値は中央値も利用できる
- 量的データには平均値も利用でき, ヒストグラムや相関なども利用できる
ポイント解説
質的データ
名義尺度と順序尺度
量的データ
間隔尺度と比例尺度
A
各尺度の違い
を例で説明する:
- 血液型(1.A型, 2.B型, ・・・)の数値比較(1<2)はできない. 順序尺度ではない.
- 体調の「1.よい・2.ふつう・3.わるい」の数値は比較できるが, 間隔は定義できない. 間隔尺度ではない.
- 西暦は1年間隔の「時」を表すが, 西暦0年は「時が無い」という絶対的なゼロではない. 比例尺度ではない.
- 年齢の「0歳」は産まれたばかりで重ねた歳がないという絶対的なゼロを表す. 比例尺度である.
B
計算の意味の有無
を例で説明する:
- 比例尺度の年齢では+1は1歳上, ×2は年の差が2倍など四則に意味がある.
- 間隔尺度の西暦ではBC100の2倍はBC200だが「時」が2倍減った訳ではなく意味がない.
- 順序尺度のデータでは 1(よい)+2(ふつう)=3(わるい)には意味がない.
発展
下位水準のデータを
上位の尺度水準と捉え
分析の幅を広げることもある.
データの尺度水準の具体例
例
名義尺度
血液型, 性別, 郵便番号
順序尺度
3つ星レストランなどの3段階評価や5段階評価, 学年
間隔尺度
西暦, 偏差値, 摂氏$({}^\circ \mathrm{C})$
比例尺度
身長, 体重, 時間, 絶対温度$(\mathrm{K})$
尺度水準の条件の整理
定義
条件 | 区分性 | 順序性 | 等間隔性 | 絶対零点 |
名義 | ◯ | |||
順序 | ◯ | ◯ | ||
間隔 | ◯ | ◯ | ◯ | |
比例 | ◯ | ◯ | ◯ | ◯ |
演算
演算 | 名義 | 順序 | 間隔 | 比例 |
大小比較 | × | ◯ | ◯ | ◯ |
加減 | × | × | ◯ | ◯ |
乗除 | × | × | × | ◯ |