統計
収集したデータの規則性を調べたり、先の予想や集めたデータを分析するための手法
データ分布の中心を表す特性値
データの代表値 | |
---|---|
平均値 | データの合計をデータ数で割った値 |
メジアン | データを大きい順or小さい順に並べた時の中央値 |
モード | もっとも多く現れたデータの値 |
データの散布度
データ分布の広がりを表す特性値
データの散布度 | |
---|---|
分散 | (個々のデータの値-平均)を2乗した値の合計をデータ数で割った値 |
標準偏差 | 分散の平方根をとった値 |
レンジ | データの最大値と最小値との差 |
- レンジ(範囲)は、データ中の最大値から最小値を引いた値。
- 分散は、平均値を中心にしたデータのバラつきの大小を見る時に使う。この数値が大きいとバラつきが大きく、数値が小さいとバラつきが小さいと判断できる。
- 標準偏差は、分散の平方根で、分散に比べてデータと尺度で分かり易い。
散布図
散布図において、プロットが右上がりであれば「正の相関」、右下がりであれば「負の相関」、どちらでもない場合は「無相関」と呼びます。
正の相関の例)人間の身長と体重
負の相関の例)マンションの賃貸価格と首都圏からの距離
【統計、データの散布度、散布図】