【統計学入門】Python – 記述統計基礎について|分散と標準偏差の出し方
記事の監修者
今回はpythonによる記述統計の基礎を実際のコードを元に説明していきたいと思います。
pythonは非常に便利なツールなのである程度、計算の中身や数式を知らずともそれらしい結果を出力することが可能です。
しかし、中身を知らないまま結果のみを見ることで本来の出力結果の意図と異なる解釈をする可能性があります。
【統計学】分散と標準偏差の数式
従って今回は、非常に身近な分散と標準偏差の求め方を実際のコードを書きつつ説明していきたいと思います。
標準偏差や分散は関数を使えばすぐ出力されますが、このように一から数式をコード化することで、理解が深まる場合もありますので是非参考にしてみてください。
まずは実際に使うデータの準備とモジュールのインポートを実施します。
今回使うデータは人の身長データになります。
分散を求める際には平均値を出す
それではまず分散を求めるうえで必要となるのが、平均値です。
本来であれば関数一つ使用すれば平均を簡単に求めることが可能ですがここでは実際に数式を使って計算していきましょう。
平均の求め方は以下になります。
この数式をpythonで記述するとこのような書き方になります。
身長の合計値をデータの数で割っています。
分散を導き出す
次に分散を求めましょう。
分散の数式は以下の通りになります。
上記をpythonで記述すると以下のような書き方になります。
heightのデータがarrayで格納されていますので、それぞれのデータをheightの平均で引き➁乗した合計をデータ数で割るという処理を行っています。
標準偏差を導き出す
最後に標準偏差ですが、標準偏差は分散の√を取ることにより取得することができます。
上記結果として、標準偏差が9.13と出力されると思います。
さていかがだったでしょうか?
基礎的な統計量である分散や標準偏差も分解してみると見た目より複雑だなと感じられる方が多かったのではないでしょうか?
普段何気なく使っている関数も中身は更に複雑に計算されている可能性がありますので、データの出力結果を見るうえで、中身の計算がどのようになっているか積極的に見ていくようにしましょう。
全国どこにいても学べる!超優良のプログラミングスクールまとめました
【国内完全網羅】現役エンジニアが厳選したおすすめのプログラミングスクール
自分の住んでるエリアでプログラミングスクールを探したい⭐️
エリア別で、おすすめのプログラミングスクールをまとめました。
ぜひ参考にしてみてくださいね。
北海道 / 東北
関東
群馬 / 栃木 / 埼玉 / 茨城 / 東京 / 千葉 / 神奈川
中部
福井 / 石川 / 岐阜 / 愛知 / 富山 / 長野 / 山梨 / 静岡 / 新潟
近畿
兵庫 / 京都 / 大阪 / 滋賀 / 奈良 / 三重 / 和歌山