
データの分析(数学1)で学習する「平均値」「分散(標準偏差)」と、統計的な推測(数学B)で学習する「期待値」「分散(標準偏差)」が同じものであることを確かめます。
平均値と期待値、分散の公式
数学1では平均値
ここで、
さて、数学Bでは期待値
ここで、
これらの公式が同じものであることを確認することが今回の目標です。
2つの単元を結びつけるために、ヒストグラムが活躍します。
データの分析と統計の違い
データを度数分布(ヒストグラム)として整理したものを頻度として考えると確率分布ができます。
データの例
次のデータを使って確率分布の考えを整理します。
データの分析の計算
データ
データ の度数分布表
階級 | 度数 |
---|---|
150 | |
160 | |
165 | |
170 | |
合計 |
データ のヒストグラム
データ の平均値と分散
この度数分布表からデータの分析の「平均値
この値と、統計的な推測で計算する期待値と分散を比較してみます。
統計の計算
さきほどの度数分布表を頻度表に変形しましょう。頻度は、そのまま確率と思ってOKです。
頻度のヒストグラムは確率分布表になります。
データ の頻度表
階級 | 頻度 |
---|---|
150 | |
160 | |
165 | |
170 | |
合計 |
データ の確率分布表
変数 | 150 | 160 | 165 | 170 |
確率 |
この頻度表および、棒グラフが意味するものが「確率分布」です。
データ の期待値と分散
確率分布から「期待値
2つの違いの整理
度数分布表から平均と分散を計算した結果と、確率分布から期待値と分散を計算した結果はピッタリ一致しました。
お分かりだと思いますが、データの分析のときの
そして、2つの計算の違いはデータの大きさの
同じ値が複数存在するデータを度数分布表に整理して頻度を考えたものが最も基本的な確率分布といえます。