成人の身長・測定誤差・試験の点数・多くの独立な観測値の平均——自然界に現れる量をほぼ何でも測ると、同じ釣り鐘型の曲線が繰り返し現れる。正規分布(normal distribution)(ガウス分布(Gaussian distribution)とも呼ばれる)は平均の普遍的な分布であり、応用数学と統計学のほぼすべての分野で不可欠だ。
ガウス積分
正規分布を定義する前に、一つの古典的な結果が必要だ:
I:=∫−∞∞e−x2dx=π.
極座標による証明。 I2 を考える:
I2=(∫−∞∞e−x2dx)(∫−∞∞e−y2dy)=∬R2e−(x2+y2)dxdy.
極座標 x=rcosθ、y=rsinθ(r≥0、θ∈[0,2π))に変換する。ヤコビアンは r で、x2+y2=r2 だ:
I2=∫02π∫0∞e−r2rdrdθ=2π∫0∞re−r2dr.
u=r2、du=2rdr と置換すると:
I2=2π∫0∞21e−udu=π⋅[−e−u]0∞=π.
I>0 なので I=π が結論される。□
x=t/2 と置換すると、すぐに有用なスケール変換した形が得られる:
∫−∞∞e−t2/2dt=2π.
標準正規分布
標準正規分布 Z∼N(0,1) の確率密度関数(PDF)は
φ(x):=2π1e−x2/2,x∈R.
φ が 1 に積分されることの検証
∫−∞∞φ(x)dx=2π1∫−∞∞e−x2/2dx=2π1⋅2π=1,
上のガウス積分の結果を使う。1/2π という因子がまさに正規化定数だ。
一般正規分布
μ∈R を位置パラメータ(平均)、σ2>0 をスケールパラメータ(分散)とする。確率変数 X が平均 μ、分散 σ2 の正規分布に従うとき、X∼N(μ,σ2) と書き、
X:=μ+σZ,Z∼N(0,1)
と定義される。同等に X の PDF は
f(x):=2πσ21exp(−2σ2(x−μ)2),x∈R.
検証。 z=(x−μ)/σ と置換すると積分 ∫−∞∞f(x)dx は ∫−∞∞φ(z)dz=1 に変換される。
パラメータ σ:=σ2 は標準偏差だ。
平均
E[X]=E[μ+σZ]=μ+σE[Z].
φ の 0 に関する対称性から E[Z]=0 だ(被積分関数 xφ(x) は奇関数)。したがって
E[X]=μ.
分散
標準正規分布の Var(Z)=E[Z2] が必要だ(E[Z]=0 なので)。u=x、dv=xe−x2/2dx として部分積分すると v=−e−x2/2:
E[Z2]=2π1∫−∞∞x2e−x2/2dx=2π1([−xe−x2/2]−∞∞+∫−∞∞e−x2/2dx).
xe−x2/2→0(∣x∣→∞)なので境界項はゼロだ。残りの積分は 2π なので
E[Z2]=2π1⋅2π=1.
したがって Var(Z)=1 だ。一般の場合は X=μ+σZ を使うと:
Var(X)=σ2Var(Z)=σ2.
アフィン安定性
定理。 X∼N(μ,σ2) かつ a,b∈R(a=0)ならば
aX+b∼N(aμ+b,a2σ2).
証明。 X=μ+σZ(Z∼N(0,1))と書く。すると
aX+b=a(μ+σZ)+b=(aμ+b)+(aσ)Z.
これは μ′=aμ+b、σ′=aσ として μ′+σ′Z の形をしており、aX+b∼N(aμ+b,a2σ2) が従う。□
系。 任意の X∼N(μ,σ2) は標準化できる:(X−μ)/σ∼N(0,1)。
中心極限定理
正規分布は多くある分布の一つに留まらない——標準化された和の普遍的な極限だ。中心極限定理(CLT:Central Limit Theorem)はこれを精密にする。
定理(CLT)。 X1,X2,… を平均 μ、有限分散 σ2>0 を持つ独立同分布(i.i.d.)の確率変数列とする。標準化された和を
Zn:=σn(X1+X2+⋯+Xn)−nμ
と定義する。このとき ZndN(0,1)(n→∞):すべての z∈R に対して
n→∞limP(Zn≤z)=Φ(z):=∫−∞zφ(t)dt.
正規分布が遍在する理由。 観測される量が、多くの小さな独立した要因の集積効果——測定ノイズ・生物学的特性・金融リターン——であれば、個々の寄与分布の形状によらず正規分布で良く近似される。CLT はベル型曲線が科学全般に現れることの数学的な説明だ。
まとめ
- Z∼N(0,1) は PDF φ(x)=2π1e−x2/2 を持つ;正規化定数 1/2π はガウス積分 ∫−∞∞e−t2/2dt=2π から従う。
- X∼N(μ,σ2) は PDF f(x)=2πσ21exp(−(x−μ)2/(2σ2)) を持ち、Z∼N(0,1) として X=μ+σZ を満たす。
- 平均: E[X]=μ(標準正規分布の対称性による)。
- 分散: Var(X)=σ2(部分積分により導出)。
- アフィン安定性: aX+b∼N(aμ+b,a2σ2);特に (X−μ)/σ∼N(0,1)。
- 中心極限定理: 任意の n 個の i.i.d. 有限分散変数の標準化された和は分布収束で N(0,1) に収束し、正規分布の遍在性を説明する。