数学のまとめ

「データの尺度水準」とは

利用可能な統計処理かを判断できるデータの性質の区分のこと。

質的データ

数値はラベルであり,

数値自体に意味はないデータ

のこと.

量的データ

数値で定義され,

数値自体に意味があるデータ

のこと.

A. データの尺度水準

  1. 名義尺度カテゴリー分けできるデータの水準である
  2. 順序尺度:(1)&カテゴリーに順序付けできるデータの水準である
  3. 間隔尺度:(2)&順序の間隔が定義でき, 等間隔であるデータの水準である
  4. 比例尺度:(3)&絶対零点があるデータの水準である

B. 尺度水準別のデータの演算の取り扱い

  1. 比例尺度は加減乗除の計算すべてに意味がある
  2. 間隔尺度は比例計算(乗除)の計算に意味がない
  3. 質的データでは四則演算のいずれも意味がない

C. 代表値・分析手法と尺度水準

  1. 名義尺度のデータは集計表などで整理し, 代表値は最頻値を利用する
  2. 順序尺度では箱ひげ図が利用でき, 代表値は中央値も利用できる
  3. 量的データには平均値も利用でき, ヒストグラムや相関なども利用できる

ポイント解説

質的データ

名義尺度と順序尺度

量的データ

間隔尺度と比例尺度

A

各尺度の違い

を例で説明する:

  1. 血液型(1.A型, 2.B型, ・・・)の数値比較(1<2)はできない. 順序尺度ではない.
  2. 体調の「1.よい・2.ふつう・3.わるい」の数値は比較できるが, 間隔は定義できない. 間隔尺度ではない.
  3. 西暦は1年間隔の「時」を表すが, 西暦0年は「時が無い」という絶対的なゼロではない. 比例尺度ではない.
  4. 年齢の「0歳」は産まれたばかりで重ねた歳がないという絶対的なゼロを表す. 比例尺度である.

B

計算の意味の有無

を例で説明する:

  1. 比例尺度の年齢では+1は1歳上, ×2は年の差が2倍など四則に意味がある.
  2. 間隔尺度の西暦ではBC100の2倍はBC200だが「時」が2倍減った訳ではなく意味がない.
  3. 順序尺度のデータでは 1(よい)+2(ふつう)=3(わるい)には意味がない.

発展

下位水準のデータを

上位の尺度水準と捉え

分析の幅を広げることもある.

データの尺度水準の具体例

名義尺度

血液型, 性別, 郵便番号

順序尺度

3つ星レストランなどの3段階評価や5段階評価, 学年

間隔尺度

西暦, 偏差値, 摂氏$({}^\circ \mathrm{C})$

比例尺度

身長, 体重, 時間, 絶対温度$(\mathrm{K})$

尺度水準の条件の整理

定義

条件区分性順序性等間隔性絶対零点
名義
順序
間隔
比例

演算

演算名義順序間隔比例
大小比較×
加減××
乗除×××

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です