数学

【正規分布】とは わかりやすくまとめてみた【Excel/Python】

『統計学』では100%といっていいほど目にする『正規分布(せいきぶんぷ)』

『正規分布』ってこんな形のグラフをしています。

『ベル』の形に似ているので『ベルカーブ』と呼ばれたり、
日本語だと『釣鐘型(つりがねがた)』と呼ばれたり、
『ガウス分布』とも呼ばれたりします。

アオキ
『ベル』はまぁわかるけど『ガウス』さんはどんな関係があるんだろ?

と思い、『正規分布』の由来から使い方までまるっとまとめてみることにしました。

Sponsored link

正規分布とは わかりやすく 由来

『正規分布』の歴史を調べてみました。

  • 1733年 フランスの『ド・モアブル』が考案
  • 1812年 フランスの『ラプラス』が式を完成
  • 1875年 『正規分布』という名前がつく
  • 1872年 『エスプリット・ジューフレ』が論文にベルカーブと記述

『正規分布』はややこしい式で表すのですが、
2人の名前をとって、
『ド・モアブル-ラプラスの定理』として呼ばれているそうです。

正規分布の曲線を描く式は、1733年にフランスのド・モアブルが考案しました。
1812年にラプラスが式を完成させたので、この式はド・モアブル-ラプラスの定理として知られています。
この式によって得られる確率分布に正規分布の名前が付いたのは1875年のことです。

正規分布 | 統計WEB

アオキ
『ラプラス』って聞くとポケモンがでてくるよね。。
アオキ
ところで『ガウス』さんはどこにでてくるの?

と思って改めて調べてみると、
どうやら『ガウス』さんは『天文学』の分野で研究していたそうです。

  • 1809年 ドイツのガウスが『天体運行論』で発表 (『誤差論』)

ガウスは天文学の観測データの解析において、誤差が、ある関数(ガウスの誤差関数)に従うと仮定して誤差理論を完成させた。
正規分布の発見 | 千葉大学理学部pdf

『天文学』の分野で研究を重ねていた『ガウス』と、
『確率』の分野で研究を重ねていた『ラプラス』。

違う分野でそれぞれ研究をしていたら、同じような法則が導きだされたという事のようです。

アオキ
違う分野から同じ法則とは、数学の真理みたいで、なんだかかっこいい成り立ちですな。

正規分布とは わかりやすく 数式

あらためて『正規分布』の形をば。

実はこのグラフ、こんな数式で描かれています。

$$ f(x) = e^{-x^2} $$

アオキ
『e』はネイピア数ですな、世にも不思議な数字です。

『ネイピア数』の関連記事

先ほどの式をベースに、2つのパラメータをインプットできるようにして、

  • 平均値(平均値)・・$$\mu$$(ミュー)
  • 標準偏差(ひょうじゅんへんさ)・・$$\sigma$$(シグマ)

うまいこと『正規分布』が描けるようになる数式がこちら。

$$f(x) = \frac{1}{\sqrt{2\pi\sigma^2}}e(-\frac{(x-\mu)^2}{2\sigma^2})$$

アオキ
おぅ。だいぶややこしい式ですな・・

『標準偏差』の関連記事

実際の計算ではパソコンがよしなにやってくれるので覚える必要はなく、

『平均値』と『標準偏差』の2つのパラメータが必要、とだけ覚えていればいいようです。

Sponsored link

正規分布とは わかりやすく Excel(エクセル)でグラフの作り方

『正規分布』は英語で『Normal Distribution(ノーマル ディストリビューション)』。

  • ディストリビューション・・分配、配布、配分

例えば『エクセル』で『正規分布』をつくる場合は、

『ノーマル ディストリビューション』を略した、『NORM.DIST』という関数を使います。

『NORM.DIST』関数は、引数を4つとります。

  • 平均値
  • 標準偏差
  • false・・確率密度変数 (trueだと累積分布関数)
アオキ
先に『標準偏差』を計算しておかないと、ですね。

『標準偏差』の関連記事

『NORM.DIST』関数を使うとこんな数字が導き出されます。

計算された値は統計学用語で、

『確率密度変数(かくりつみつどへんすう)』というそうです。

計算したい『値』と、
『確率密度変数(かくりつみつどへんすう)』を選択して、

グラフ->散布図 にすると、こんなグラフが表示されます。

アオキ
まさにベルカーブですな・・!

正規分布とは わかりやすく Python(パイソン)でグラフの作り方

数値計算に強い『Python(パイソン)』ではいくつも作り方があります。

今回は科学計算向けライブラリ『scipy(サイパイ)』を使った例を。

# インポート
import numpy as np
from scipy.stats import norm
import matplotlib.pyplot as plt

# 0から100まで、0.1間隔で入ったリストXを作る
X = np.arange(0,100,0.1)

# 確率密度関数に、X,平均50、標準偏差20を代入
# pdfは確率密度変数 (Probability density function の略)
Y = norm.pdf(X,50,20)

# 色をつけて表示
plt.plot(X,Y,color='blue')
plt.show()

するとこんなグラフが表示されます。

アオキ
Pythonは数値計算する方法がたくさんあるので徐々に覚えていきたいところです。

環境設定の参考記事

Sponsored link

正規分布をわかりやすく変換したのが標準正規分布

『正規分布』は下記2つのパラメータをとって描かれるのですが、

  • 平均値(平均値)・・$$\mu$$(ミュー)
  • 標準偏差(ひょうじゅんへんさ)・・$$\sigma$$(シグマ)

よりシンプルに、わかりやすくするために、

平均値を0、標準偏差を1に変換した分布を作ることもあります。

アオキ
平均値を0、標準偏差を1にすることを『標準化』と呼ぶそうです。
  • 平均値(平均値)・・0に変換
  • 標準偏差(ひょうじゅんへんさ)・・1に変換
  • 標準化(ひょうじゅんか)・・平均値を0、標準偏差を1に変換すること
  • 標準化・・英語でNormalize(ノーマライズ)

『標準化(ひょうじゅんか)』した分布は特別に、

『標準正規分布(ひょうじゅんせいきぶんぷ)』と名付けられています。

  • 標準正規分布・・英語で Normal Standard Distribution(ノーマル スタンダード ディストリビューション)

正規分布とは わかりやすくまとめてみて

統計学の中でもっとも重要とされている『正規分布』。

調べれば調べるほど専門用語たっぷりになってしまうので、

わかりやすさを重視して、あえて、

できるだけ専門用語を使わない形でまとめてみました。

『統計学』の本や計算は総じて難しく書いてあるなと思うのですが、

こと計算するだけなら、『Excel(エクセル)』や『Python(パイソン)』を使えばさくっと計算できるので、

やりながら覚えていくスタイルということで、これからも手を動かしつつ記事化していければと思います。

アオキ
きたるAI時代を楽しく乗りこなしたいもんですね。

『統計学』関係ではこんな記事も読まれています。

1. 【分散】【標準偏差】とは わかりやすくまとめてみた【ExcelとPython】

2. 【正規分布】とは わかりやすくまとめてみた【ExcelとPython】

3. 【確率】当たりがでる確率を計算する方法【二項分布】【Excel/Python】

4. 順列・組み合わせ・階乗とは わかりやすくまとめてみた【数学】

5. 【確率(加法定理)】とは わかりやすくまとめてみた【※初心者向け】

6. 【条件付き確率】とは わかりやすくまとめてみた

アオキ
ツイッターでも記事ネタ含めちょろちょろ書いていくので、よろしければぜひフォローお願いしますm(_ _ )m

アオキのツイッターアカウント


関連記事一覧 (一部広告あり)

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

CAPTCHA


最近の記事

アーカイブ

  1. オンライン教材

    【ChatGPT】エンジニア編をリリースしました
  2. データベース

    MySQLの講座をリリースしました
  3. 生成AI

    Dify講座をリリースしました【非エンジニア向け】
  4. オンライン教材

    【React】初心者向け講座をリリースしました【MUI】【Udemy】
  5. オンライン教材

    ChatGPTをビジネス活用する講座をリリースしました【Udemy】
PAGE TOP
Ads Blocker Image Powered by Code Help Pro

広告ブロックを摘出しました!!

ブラウザ拡張を使用して広告をブロックしていることが摘出されました。

ブラウザの広告ブロッカーの機能を無効にするか、
当サイトのドメインをホワイトリストに追加し、「更新」をクリックして下さい。

あなたが広告をブロックする権利があるように、
当方も広告をブロックしている人にコンテンツを提供しない権利と自由があります。

Powered By
Best Wordpress Adblock Detecting Plugin | CHP Adblock