数学

【分散】【標準偏差】とは わかりやすくまとめてみた【ExcelとPython】

『統計学』に取り組みだすと必ず出会うのが、

『分散(ぶんさん)』や
『標準偏差(ひょうじゅんへんさ)』という用語。

アオキ
何度か取り組んでいたものの、いつの間にか忘れて・・・

を繰り返していたので、
まるっとまとめておくことにしました。

Sponsored link

分散と標準偏差をExcel(エクセル)で計算してみる

ものは試しと、
『Excel(エクセル)』で計算しつつ、用語や数式を整理してみることにします。

エクセルで平均値を出してみる

ざっと表をつくって、
まずは『平均値(Average:アベレージ)』をだしてみます。

エクセルで偏差を計算してみる

『偏差(へんさ)』は、それぞれの値から平均値を引いた値の事になります。

  • 偏差(へんさ)・・それぞれの値 – 平均値

数式で書くとこうなります。

偏差 = $ x_i – \bar{ x } $

  • iはそれぞれの値を表します。今回の場合$ x_1$は480、$ x_2$は380です。
  • $ \bar{ x } $・・バーをつけて平均値を表しているそうです。

『偏差(へんさ)』の英語は『Deviation(デビエーション)』になります。

Sponsored link

エクセルで偏差平方を計算してみる

『偏差(へんさ)』のままだと、
マイナスの値が混ざった時に数字が小さくなってしまうので、

二乗してプラスに変換しておきます。

アオキ
『エクセル』では『^』の記号を使うとOKです。

二乗した値の事を、『偏差平方(へんさへいほう)』というそうです。

数式で書くとこうなります。

偏差平方 = $ (x_i – \bar{ x })^2 $

エクセルで分散を計算してみる

二乗した値を全部足して、平均した値が、『分散(ぶんさん)』になります。

  • 分散・・英語でVariance(ヴァリアンス)

数式はこうなります。

分散 $ \sigma^2 = \frac{1}{n}\displaystyle\sum_{i=1}^n (x_i – \bar{x})^2 $

アオキ
シグマがでるとなんじゃこりゃ~と感じますが、実はシグマは『sum』関数の意味で、全部足すという意味だったりします。

『シグマ』の関連記事

それぞれの値を平均値で引いたものを2乗して、全部足して平均出してる、という式になります。

※『$\sigma$』は小文字のシグマ。

Sponsored link

エクセルで標準偏差を計算してみる

『分散(ぶんさん)』は二乗の平均になっているので、

『平方根(へいほうこん)(ルート)』をかけて、二乗をときます。

アオキ
表現が難しい・・

『Excel(エクセル)』だと『SQRT』関数になります。

  • 平行根(へいほうこん)・・英語でSquare Root (スクウェアルート)

『平方根(ルート)』をかけた値が、

『標準偏差(ひょうじゅんへんさ)』になります。

  • 標準偏差・・平均値の周りにデータがどれくらい散らばっているかという指標
  • 標準偏差・・英語でStandard Deviation(スタンダード デビエーション)

数式だとこうなります。

標準偏差 $ \sigma = \sqrt{\frac{1}{n}\displaystyle\sum_{i=1}^n (x_i – \bar{x})^2} $

アオキ
2乗してルートをかけることで、マイナスをなくしているわけですな。

標準偏差の意味

『標準偏差』は、『平均値』からのばらつきを表しています。

『平均値』± 『標準偏差』 の間にだいたいの人が入る、という事を意味していて、

『正規分布』の場合はこの表の割合に収束していくそうです。

範囲 範囲内に現れる確率 偏差値の場合
平均値±標準偏差(σ) 68.3% 40~60
平均値±(標準偏差×2) (2σ) 95.4% 30~70
平均値±(標準偏差×3) (3σ) 99.7% 20~80
アオキ
今回のサンプルだとデータが少ないので、もっとたくさんのデータで試すとこの割合になっていくんでしょうな。

また、
学校の勉強でおなじみの『偏差値(へんさち)』も、
『標準偏差』を使って算出されているそうです。

偏差値 = $\frac{得点 -平均点}{標準偏差} \times 10 + 50$

アオキ
偏差値・・そんなのもあったなぁ・・←遠い目

分散と標準偏差をExcel(エクセル)関数で計算してみる

『Excel(エクセル)』関数を使うとさくっと計算できます。

『分散(ぶんさん)』を計算するには、
『VAR.P』関数を使います。

  • VAR.P関数・・Variance Population(ポピュレーションは母集団の意味)

『標準偏差(ひょうじゅんへんさ)』を計算するには、
『STDEV.P』関数を使います。

  • STDEV.P関数・・Standard Deviation Population の略 標準偏差・母集団

Sponsored link

分散と標準偏差をPython(パイソン)で計算してみる

『Python(パイソン)』の場合、
計算する方法がいくつかありますが、

標準ライブラリの『Statistics(スタティスティックス:統計学という意味)』を使ってみます。

関数名に、『母集団(ぼしゅうだん:Population)』のPが頭につく形です。

『標本(ひょうほん:Sample)』の場合は それぞれ頭がSになります。

  • svariance
  • sstdev

関連記事

分散と標準偏差をまとめてみて

『統計学』を学んでいく上で欠かせない『分散(ぶんさん)』と『標準偏差(ひょうじゅんへんさ)』。

特に『標準偏差』は、

これまた『統計学』では欠かせない『正規分布(せいきぶんぷ)』で使われたりするので、

しっかり整理・理解して、使いこなせるようになりたいもんです。

created by Rinker
¥2,484 (2019/09/23 00:36:06時点 Amazon調べ-詳細)

  

created by Rinker
¥3,445 (2019/09/22 23:28:00時点 Amazon調べ-詳細)

『エクセルVBA・分析・統計』関係ではこんな記事も読まれています。

1. 【ExcelVBA(マクロ)】(エクセル)よく使う書き方をまとめてみた【随時更新】

2. 【Excel(エクセル)】よく使う関数をまとめてみた(組み合わせもあり)

3. 【ピボットテーブル】の使い方をわかりやすくまとめてみた【初心者向け】

4. 【Excel(エクセル)】確率・統計でよく使う関数をまとめてみた【随時更新】

5. 【分散】【標準偏差】とは わかりやすくまとめてみた【ExcelとPython】

6. 【データドリブンマーケティング】の本を頼りにデータ分析力を高めていくべし【統計学】

7. 【正規分布】とは わかりやすくまとめてみた【ExcelとPython】

8. 【確率】当たりがでる確率を計算する方法【二項分布】【Excel/Python】

9. 【条件付き確率】とは わかりやすくまとめてみた

10. 【エクセルvba(マクロ)】でできる事を増やし使える人になったら女の子に「すごぃ!」って言われた時の話

『統計学』関係ではこんな記事も読まれています。

1. 【分散】【標準偏差】とは わかりやすくまとめてみた【ExcelとPython】

2. 【正規分布】とは わかりやすくまとめてみた【ExcelとPython】

3. 【確率】当たりがでる確率を計算する方法【二項分布】【Excel/Python】

4. 順列・組み合わせ・階乗とは わかりやすくまとめてみた【数学】

5. 【確率(加法定理)】とは わかりやすくまとめてみた【※初心者向け】

6. 【条件付き確率】とは わかりやすくまとめてみた

アオキ
ツイッターでも記事ネタ含めちょろちょろ書いていくので、よろしければぜひフォローお願いしますm(_ _ )m

アオキのツイッターアカウント


関連記事一覧 (一部広告あり)

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

CAPTCHA


最近の記事

  1. 音楽

    コードの転回形の練習方法をまとめてみた【大人のピアノ】
  2. 学び・教育

    『ニュータイプの時代』〜リベラルアーツとテクノロジーの融合〜
  3. バックエンド

    【Python】手軽に試す方法2つとwebフレームワークについて【初心者向け】
  4. CG関連

    【3Dプログラム】初心者にオススメな方法はこれ(9)【P5.js】
  5. バックエンド

    【Laravel(PHP)】初心者向け アプリのつくり方 をリリースしました【t…
PAGE TOP