トップ > スキル : IT系ラーニング > 基礎理論 > 応用数学

IT系ラーニング_基礎理論

統計、データの散布度、散布図

統計

収集したデータの規則性を調べたり、先の予想や集めたデータを分析するための手法

データ分布の中心を表す特性値
データの代表値
平均値 データの合計をデータ数で割った値
メジアン データを大きい順or小さい順に並べた時の中央値
モード もっとも多く現れたデータの値

データの散布度

データ分布の広がりを表す特性値
データの散布度
分散 (個々のデータの値-平均)を2乗した値の合計をデータ数で割った値
標準偏差 分散の平方根をとった値
レンジ データの最大値と最小値との差
  • レンジ(範囲)は、データ中の最大値から最小値を引いた値。
  • 分散は、平均値を中心にしたデータのバラつきの大小を見る時に使う。この数値が大きいとバラつきが大きく、数値が小さいとバラつきが小さいと判断できる。
  • 標準偏差は、分散の平方根で、分散に比べてデータと尺度で分かり易い。

散布図

散布図において、プロットが右上がりであれば「正の相関」、右下がりであれば「負の相関」、どちらでもない場合は「無相関」と呼びます。

正の相関の例)人間の身長と体重
負の相関の例)マンションの賃貸価格と首都圏からの距離

正規分布

【統計、データの散布度、散布図】