ガンマ分布

Essential
最終更新: タグ: 確率, 確率変数, 分布

前提知識

レート λ\lambda のポアソン過程で事象が起き、α\alpha 番目の事象が到来するまでの時間を知りたいとする。最初の事象までの待機時間は指数分布に従う;α\alpha 番目の事象までの待機時間はガンマ分布(Gamma distribution)に従う——指数分布を任意の事象数に一般化した二パラメータ族だ。

ガンマ関数

分布を定義する前に、ガンマ関数(gamma function)Γ:(0,)(0,)\Gamma : (0, \infty) \to (0, \infty) を思い出す:

Γ(α)0tα1etdt.\Gamma(\alpha) \coloneqq \int_0^{\infty} t^{\alpha - 1} e^{-t}\, dt.

Γ\Gamma を正規化定数として適切たらしめる二つの重要な性質がある:

漸化式。 部分積分により Γ(α+1)=αΓ(α)\Gamma(\alpha + 1) = \alpha\,\Gamma(\alpha) がすべての α>0\alpha > 0 で成り立つ。

整数値。 Γ(1)=0etdt=1\Gamma(1) = \int_0^\infty e^{-t}\,dt = 1 と漸化式を合わせると

Γ(n)=(n1)!(すべての正の整数 n に対して).\Gamma(n) = (n-1)! \quad \text{(すべての正の整数 $n$ に対して)}.

半整数。 有名な結果として Γ(1/2)=π\Gamma(1/2) = \sqrt{\pi} が成り立ち、Γ\Gamma が非整数引数へ階乗を拡張することを示す。

定義

α>0\alpha > 0形状パラメータ(shape parameter)、λ>0\lambda > 0レートパラメータとする。確率変数 XX がガンマ分布に従うとき、XGamma(α,λ)X \sim \operatorname{Gamma}(\alpha, \lambda) と書き、その確率密度関数

f(x)λαΓ(α)xα1eλx,x>0.f(x) \coloneqq \frac{\lambda^\alpha}{\Gamma(\alpha)}\, x^{\alpha-1} e^{-\lambda x}, \quad x > 0.

α=1\alpha = 1 のとき f(x)=λeλxf(x) = \lambda e^{-\lambda x} となり、Exp(λ)\operatorname{Exp}(\lambda) が復元される。大きな α\alpha は確率質量をより大きな値に向けてシフトし、より多くの事象を待つ長い待機時間を反映する。

ff が正当な PDF であることの検証

非負性は明らか。積分については uλxu \coloneqq \lambda xx=u/λx = u/\lambdadx=du/λdx = du/\lambda)と置換すると:

0λαΓ(α)xα1eλxdx=λαΓ(α)0(uλ)α1euduλ=1Γ(α)0uα1eudu=Γ(α)Γ(α)=1.\int_0^{\infty} \frac{\lambda^\alpha}{\Gamma(\alpha)}\, x^{\alpha-1} e^{-\lambda x}\, dx = \frac{\lambda^\alpha}{\Gamma(\alpha)} \int_0^{\infty} \left(\frac{u}{\lambda}\right)^{\alpha-1} e^{-u} \frac{du}{\lambda} = \frac{1}{\Gamma(\alpha)} \int_0^{\infty} u^{\alpha-1} e^{-u}\, du = \frac{\Gamma(\alpha)}{\Gamma(\alpha)} = 1.

指数確率変数の和

ガンマ分布を理解する最も具体的な方法は指数分布との関係を通してだ。整数 α=n\alpha = n の場合:

定理。 X1,X2,,XnX_1, X_2, \ldots, X_n が独立で各 XiExp(λ)X_i \sim \operatorname{Exp}(\lambda) ならば

SnX1+X2++XnGamma(n,λ).S_n \coloneqq X_1 + X_2 + \cdots + X_n \sim \operatorname{Gamma}(n, \lambda).

モーメント母関数による証明。 XiExp(λ)X_i \sim \operatorname{Exp}(\lambda) の MGF は

MXi(t)=E[etXi]=λλt,t<λ.M_{X_i}(t) = E[e^{tX_i}] = \frac{\lambda}{\lambda - t}, \quad t < \lambda.

XiX_i が独立なので、和の MGF は因数分解される:

MSn(t)=i=1nMXi(t)=(λλt)n.M_{S_n}(t) = \prod_{i=1}^n M_{X_i}(t) = \left(\frac{\lambda}{\lambda - t}\right)^n.

Gamma(n,λ)\operatorname{Gamma}(n, \lambda) が同じ MGF を持つことが(置換 u=(λt)xu = (\lambda - t)x を使った E[etX]E[e^{tX}] の計算で)確認でき、MGF は分布を一意に決定するので SnGamma(n,λ)S_n \sim \operatorname{Gamma}(n, \lambda) が従う。\square

ポアソン過程の解釈では:SnS_nnn 番目の到着時刻であり、定理はこれが Gamma(n,λ)\operatorname{Gamma}(n, \lambda) であることを確認する。

平均

XGamma(α,λ)X \sim \operatorname{Gamma}(\alpha, \lambda) の平均は Γ\Gamma の漸化式から読み取れる:

E[X]=0xλαΓ(α)xα1eλxdx=λαΓ(α)0xαeλxdx.E[X] = \int_0^{\infty} x \cdot \frac{\lambda^\alpha}{\Gamma(\alpha)}\, x^{\alpha-1} e^{-\lambda x}\, dx = \frac{\lambda^\alpha}{\Gamma(\alpha)} \int_0^{\infty} x^{\alpha} e^{-\lambda x}\, dx.

u=λxu = \lambda x と置換すると 0xαeλxdx=Γ(α+1)/λα+1\int_0^\infty x^\alpha e^{-\lambda x}\,dx = \Gamma(\alpha+1)/\lambda^{\alpha+1} が得られ、

E[X]=λαΓ(α)Γ(α+1)λα+1=Γ(α+1)λΓ(α)=αΓ(α)λΓ(α)=αλ.E[X] = \frac{\lambda^\alpha}{\Gamma(\alpha)} \cdot \frac{\Gamma(\alpha+1)}{\lambda^{\alpha+1}} = \frac{\Gamma(\alpha+1)}{\lambda\,\Gamma(\alpha)} = \frac{\alpha\,\Gamma(\alpha)}{\lambda\,\Gamma(\alpha)} = \frac{\alpha}{\lambda}.

整数 α=n\alpha = n の場合、これは直観と一致する:nn 個の独立な Exp(λ)\operatorname{Exp}(\lambda) 事象の期待待機時間は n(1/λ)n \cdot (1/\lambda) だ。

分散

同様に同じ置換で E[X2]E[X^2] を計算する:

E[X2]=λαΓ(α)Γ(α+2)λα+2=α(α+1)λ2.E[X^2] = \frac{\lambda^\alpha}{\Gamma(\alpha)} \cdot \frac{\Gamma(\alpha+2)}{\lambda^{\alpha+2}} = \frac{\alpha(\alpha+1)}{\lambda^2}.

したがって

Var(X)=E[X2](E[X])2=α(α+1)λ2α2λ2=αλ2.\operatorname{Var}(X) = E[X^2] - (E[X])^2 = \frac{\alpha(\alpha+1)}{\lambda^2} - \frac{\alpha^2}{\lambda^2} = \frac{\alpha}{\lambda^2}.

加法的性質

上の MGF の議論から加法的性質が導かれる:X1Gamma(α1,λ)X_1 \sim \operatorname{Gamma}(\alpha_1, \lambda)X2Gamma(α2,λ)X_2 \sim \operatorname{Gamma}(\alpha_2, \lambda) が独立で同じレートを持つとき、

X1+X2Gamma(α1+α2,λ).X_1 + X_2 \sim \operatorname{Gamma}(\alpha_1 + \alpha_2,\, \lambda).

形状パラメータは加算され、レートは保持される。これは指数分布の和の解釈と整合する:α1\alpha_1 個と α2\alpha_2 個の i.i.d. Exp(λ)\operatorname{Exp}(\lambda) 待機時間を合わせると Gamma(α1+α2,λ)\operatorname{Gamma}(\alpha_1 + \alpha_2, \lambda) の待機時間になる。なお加法的性質は二つのレートが異なる場合には成り立たない。

まとめ

  • ガンマ関数 Γ(α)=0tα1etdt\Gamma(\alpha) = \int_0^\infty t^{\alpha-1} e^{-t}\,dtΓ(α+1)=αΓ(α)\Gamma(\alpha+1) = \alpha\,\Gamma(\alpha) と正の整数 nn に対して Γ(n)=(n1)!\Gamma(n) = (n-1)! を満たす。
  • XGamma(α,λ)X \sim \operatorname{Gamma}(\alpha, \lambda) は PDF f(x)=λαxα1eλx/Γ(α)f(x) = \lambda^\alpha x^{\alpha-1} e^{-\lambda x} / \Gamma(\alpha)x>0x > 0)を持ち、形状 α>0\alpha > 0 とレート λ>0\lambda > 0 を持つ。
  • 整数 α=n\alpha = n の場合:nn 個の独立な Exp(λ)\operatorname{Exp}(\lambda) 変数の和は Gamma(n,λ)\operatorname{Gamma}(n, \lambda) だ。
  • 平均:E[X]=α/λE[X] = \alpha/\lambda
  • 分散:Var(X)=α/λ2\operatorname{Var}(X) = \alpha/\lambda^2
  • 加法的性質:独立な Gamma(α1,λ)\operatorname{Gamma}(\alpha_1, \lambda)Gamma(α2,λ)\operatorname{Gamma}(\alpha_2, \lambda) の和は Gamma(α1+α2,λ)\operatorname{Gamma}(\alpha_1 + \alpha_2, \lambda)