『統計学』に取り組みだすと必ず出会うのが、
『分散(ぶんさん)』や
『標準偏差(ひょうじゅんへんさ)』という用語。
を繰り返していたので、
まるっとまとめておくことにしました。
分散と標準偏差をExcel(エクセル)で計算してみる
ものは試しと、
『Excel(エクセル)』で計算しつつ、用語や数式を整理してみることにします。
エクセルで平均値を出してみる
ざっと表をつくって、
まずは『平均値(Average:アベレージ)』をだしてみます。
エクセルで偏差を計算してみる
『偏差(へんさ)』は、それぞれの値から平均値を引いた値の事になります。
- 偏差(へんさ)・・それぞれの値 – 平均値
数式で書くとこうなります。
偏差 = $$ x_i – \bar{ x } $$
- iはそれぞれの値を表します。今回の場合$$ x_1$$は480、$$ x_2$$は380です。
- $$ \bar{ x } $$・・バーをつけて平均値を表しているそうです。
『偏差(へんさ)』の英語は『Deviation(デビエーション)』になります。
エクセルで偏差平方を計算してみる
『偏差(へんさ)』のままだと、
マイナスの値が混ざった時に数字が小さくなってしまうので、
二乗してプラスに変換しておきます。
二乗した値の事を、『偏差平方(へんさへいほう)』というそうです。
数式で書くとこうなります。
偏差平方 = $$ (x_i – \bar{ x })^2 $$
エクセルで分散を計算してみる
二乗した値を全部足して、平均した値が、『分散(ぶんさん)』になります。
- 分散・・英語でVariance(ヴァリアンス)
数式はこうなります。
分散 $$ \sigma^2 = \frac{1}{n}\displaystyle\sum_{i=1}^n (x_i – \bar{x})^2 $$
『シグマ』の関連記事
それぞれの値を平均値で引いたものを2乗して、全部足して平均出してる、という式になります。
※『$$\sigma$$』は小文字のシグマ。
エクセルで標準偏差を計算してみる
『分散(ぶんさん)』は二乗の平均になっているので、
『平方根(へいほうこん)(ルート)』をかけて、二乗をときます。
『Excel(エクセル)』だと『SQRT』関数になります。
- 平行根(へいほうこん)・・英語でSquare Root (スクウェアルート)
『平方根(ルート)』をかけた値が、
『標準偏差(ひょうじゅんへんさ)』になります。
- 標準偏差・・平均値の周りにデータがどれくらい散らばっているかという指標
- 標準偏差・・英語でStandard Deviation(スタンダード デビエーション)
数式だとこうなります。
標準偏差 $$ \sigma = \sqrt{\frac{1}{n}\displaystyle\sum_{i=1}^n (x_i – \bar{x})^2} $$
標準偏差の意味
『標準偏差』は、『平均値』からのばらつきを表しています。
『平均値』± 『標準偏差』 の間にだいたいの人が入る、という事を意味していて、
『正規分布』の場合はこの表の割合に収束していくそうです。
範囲 | 範囲内に現れる確率 | 偏差値の場合 |
---|---|---|
平均値±標準偏差(σ) | 68.3% | 40~60 |
平均値±(標準偏差×2) (2σ) | 95.4% | 30~70 |
平均値±(標準偏差×3) (3σ) | 99.7% | 20~80 |
また、
学校の勉強でおなじみの『偏差値(へんさち)』も、
『標準偏差』を使って算出されているそうです。
偏差値 = $$\frac{得点 -平均点}{標準偏差} \times 10 + 50$$
分散と標準偏差をExcel(エクセル)関数で計算してみる
『Excel(エクセル)』関数を使うとさくっと計算できます。
『分散(ぶんさん)』を計算するには、
『VAR.P』関数を使います。
- VAR.P関数・・Variance Population(ポピュレーションは母集団の意味)
『標準偏差(ひょうじゅんへんさ)』を計算するには、
『STDEV.P』関数を使います。
- STDEV.P関数・・Standard Deviation Population の略 標準偏差・母集団
分散と標準偏差をPython(パイソン)で計算してみる
『Python(パイソン)』の場合、
計算する方法がいくつかありますが、
標準ライブラリの『Statistics(スタティスティックス:統計学という意味)』を使ってみます。
import statistics as st array = [480,380,400,410,360,530,470,530] print(st.pvariance(array)) # 分散 # 3875 print(st.pstdev(array)) # 標準偏差 # 62.24949798994366
関数名に、『母集団(ぼしゅうだん:Population)』のPが頭につく形です。
『標本(ひょうほん:Sample)』の場合は それぞれ頭がSになります。
- svariance
- sstdev
関連記事
分散と標準偏差をまとめてみて
『統計学』を学んでいく上で欠かせない『分散(ぶんさん)』と『標準偏差(ひょうじゅんへんさ)』。
特に『標準偏差』は、
これまた『統計学』では欠かせない『正規分布(せいきぶんぷ)』で使われたりするので、
しっかり整理・理解して、使いこなせるようになりたいもんです。
『エクセルVBA・分析・統計』関係ではこんな記事も読まれています。
1. 【ExcelVBA】初心者向け講座をリリースしました。2. 【ExcelVBA(マクロ)】(エクセル)よく使う書き方をまとめてみた【随時更新】
3. 【Excel(エクセル)】よく使う関数をまとめてみた(組み合わせもあり)
4. 【ピボットテーブル】の使い方をわかりやすくまとめてみた【初心者向け】
5. 【Excel(エクセル)】確率・統計でよく使う関数をまとめてみた【随時更新】
6. 【分散】【標準偏差】とは わかりやすくまとめてみた【ExcelとPython】
7. 【データドリブンマーケティング】の本を頼りにデータ分析力を高めていくべし【統計学】
8. 【正規分布】とは わかりやすくまとめてみた【ExcelとPython】
9. 【確率】当たりがでる確率を計算する方法【二項分布】【Excel/Python】
10. エクセルマクロで勤務表の自動チェックを依頼され2時間でつくった話
11. 【エクセルvba(マクロ)】でできる事を増やし使える人になったら女の子に「すごぃ!」って言われた時の話
『統計学』関係ではこんな記事も読まれています。
1. 【分散】【標準偏差】とは わかりやすくまとめてみた【ExcelとPython】2. 【正規分布】とは わかりやすくまとめてみた【ExcelとPython】
3. 【確率】当たりがでる確率を計算する方法【二項分布】【Excel/Python】
4. 順列・組み合わせ・階乗とは わかりやすくまとめてみた【数学】
5. 【確率(加法定理)】とは わかりやすくまとめてみた【※初心者向け】
6. 【条件付き確率】とは わかりやすくまとめてみた
アオキのツイッターアカウント。
この記事へのコメントはありません。