分布の畳み込み

Essential
最終更新: タグ: 確率, 確率変数, 分布

二つの独立な確率変数を足したとき、その和はどんな分布になるか?答えは両者の分布の畳み込み(convolution)——一方を他方の上でスライドさせながら組み合わせる数学的演算だ。畳み込みは二項分布・ポアソン分布・正規分布がそれぞれ加法的に振る舞う理由を説明し、分布の代数とモーメント母関数の代数を結びつける架け橋だ。

畳み込みの公式

XXYY独立な 確率変数、Z=X+YZ = X + Y とする。

絶対連続の場合

XXYY が密度 fXf_XfYf_Y を持つとき、ZZ の密度は

fZ(z)=(fXfY)(z)+fX(x)fY(zx)dx.(1)f_Z(z) = (f_X * f_Y)(z) \coloneqq \int_{-\infty}^{+\infty} f_X(x) \, f_Y(z - x) \, dx. \tag{1}

導出。 独立性より (X,Y)(X, Y) の同時密度は fX,Y(x,y)=fX(x)fY(y)f_{X,Y}(x, y) = f_X(x) f_Y(y) と分解される。事象 {Zz}\{Z \leq z\}{X+Yz}\{X + Y \leq z\} だ。この領域で積分すると:

FZ(z)=P(X+Yz)=+zxfX(x)fY(y)dydx=+fX(x)FY(zx)dx.F_Z(z) = P(X + Y \leq z) = \int_{-\infty}^{+\infty} \int_{-\infty}^{z-x} f_X(x) f_Y(y) \, dy \, dx = \int_{-\infty}^{+\infty} f_X(x) F_Y(z - x) \, dx.

zz について微分すると公式 (1)(1) が得られる。

離散の場合

XXYYZ\mathbb{Z}(または共通の可算集合)に値をとり、PMF をそれぞれ pXp_XpYp_Y とするとき、Z=X+YZ = X + Y の PMF は

pZ(n)=(pXpY)(n)k=+pX(k)pY(nk).(2)p_Z(n) = (p_X * p_Y)(n) \coloneqq \sum_{k=-\infty}^{+\infty} p_X(k) \, p_Y(n - k). \tag{2}

これは (1)(1) の離散版で、積分の代わりに nnkkXX から)と nkn - kYY から)に分割するすべての方法について和をとる。

畳み込みの交換律と結合律

測度(または関数)に対する畳み込み演算は次を満たす:

fXfY=fYfX(交換律)f_X * f_Y = f_Y * f_X \qquad \text{(交換律)} (fXfY)fZ=fX(fYfZ)(結合律).(f_X * f_Y) * f_Z = f_X * (f_Y * f_Z) \qquad \text{(結合律)}.

交換律は X+Y=Y+XX + Y = Y + X の対称性から明らか。結合律は、三つ(以上)の独立な変数の和の分布を任意の二つを先に畳み込むことで計算できることを意味する。

主要な例

二項分布の和

XBin(m,p)X \sim \operatorname{Bin}(m, p)YBin(n,p)Y \sim \operatorname{Bin}(n, p) が独立ならば X+YBin(m+n,p)X + Y \sim \operatorname{Bin}(m+n, p) だ。

畳み込みによる証明。 Bin(m,p)\operatorname{Bin}(m, p) の PMF は pX(k)=(mk)pk(1p)mkp_X(k) = \binom{m}{k} p^k (1-p)^{m-k} だ。畳み込むと:

pZ(r)=k=0r(mk)pk(1p)mk(nrk)prk(1p)n(rk)=pr(1p)m+nrk=0r(mk)(nrk).p_Z(r) = \sum_{k=0}^{r} \binom{m}{k} p^k (1-p)^{m-k} \cdot \binom{n}{r-k} p^{r-k} (1-p)^{n-(r-k)} = p^r (1-p)^{m+n-r} \sum_{k=0}^r \binom{m}{k}\binom{n}{r-k}.

ヴァンデルモンドの畳み込み恒等式 k=0r(mk)(nrk)=(m+nr)\sum_{k=0}^r \binom{m}{k}\binom{n}{r-k} = \binom{m+n}{r} より pZ(r)=(m+nr)pr(1p)m+nrp_Z(r) = \binom{m+n}{r} p^r (1-p)^{m+n-r} となり、これは Bin(m+n,p)\operatorname{Bin}(m+n,p) の PMF だ。

これは解釈からも直ちに従う:Bin(m,p)\operatorname{Bin}(m, p)mm 回の独立なベルヌーイ試行の成功数であり、mm 回と nn 回の独立な試行を合わせれば m+nm+n 回の試行となる。

ポアソン分布の和

XPoisson(λ)X \sim \operatorname{Poisson}(\lambda)YPoisson(μ)Y \sim \operatorname{Poisson}(\mu) が独立ならば X+YPoisson(λ+μ)X + Y \sim \operatorname{Poisson}(\lambda + \mu) だ。

畳み込みによる証明。

pZ(n)=k=0neλλkk!eμμnk(nk)!=e(λ+μ)n!k=0n(nk)λkμnk=e(λ+μ)(λ+μ)nn!,p_Z(n) = \sum_{k=0}^{n} \frac{e^{-\lambda}\lambda^k}{k!} \cdot \frac{e^{-\mu}\mu^{n-k}}{(n-k)!} = \frac{e^{-(\lambda+\mu)}}{n!} \sum_{k=0}^{n} \binom{n}{k} \lambda^k \mu^{n-k} = \frac{e^{-(\lambda+\mu)}(\lambda+\mu)^n}{n!},

これは Poisson(λ+μ)\operatorname{Poisson}(\lambda + \mu) だ。

正規分布の和

XN(μ1,σ12)X \sim \operatorname{N}(\mu_1, \sigma_1^2)YN(μ2,σ22)Y \sim \operatorname{N}(\mu_2, \sigma_2^2) が独立ならば X+YN(μ1+μ2,σ12+σ22)X + Y \sim \operatorname{N}(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2) だ。

密度の畳み込み積分は平方完成によって計算できるが、MGF を用いる方がよりエレガントだ(後述)。重要な点は、正規分布族は畳み込みで閉じている——独立な正規分布の和は正規分布であり、平均と分散はそれぞれ加算される。

ガンマ分布の和

XGamma(α,λ)X \sim \operatorname{Gamma}(\alpha, \lambda)YGamma(β,λ)Y \sim \operatorname{Gamma}(\beta, \lambda) が独立で(同じレート λ\lambda を持つとき)、X+YGamma(α+β,λ)X + Y \sim \operatorname{Gamma}(\alpha + \beta, \lambda) だ。

これは整数 α\alpha の場合、Gamma(α,λ)\operatorname{Gamma}(\alpha, \lambda)α\alpha 個の独立な Exp(λ)\operatorname{Exp}(\lambda) 変数の和として表せることから従い、非整数 α\alpha へは MGF による議論で拡張される。

モーメント母関数との関係

MGF の乗法的性質は畳み込みの代数的反映だ。独立な XXYY に対して:

MX+Y(t)=MX(t)MY(t).M_{X+Y}(t) = M_X(t) \cdot M_Y(t).

これが成り立つ理由:密度の畳み込み (fXfY)(z)(f_X * f_Y)(z) は、それぞれのラプラス変換(s=ts = -t とおく)の積 f^X(t)f^Y(t)\hat{f}_X(t) \cdot \hat{f}_Y(t) に正確に対応するからだ。MGF は分布の(両側)ラプラス変換そのものなので、MGF の乗算は分布の畳み込みに対応する。

この関係により MGF は和の分布を計算する最も鋭い道具となる。畳み込み積分を直接評価する代わりに:

  1. MX(t)M_X(t)MY(t)M_Y(t) を計算する。
  2. 掛け合わせる:MZ(t)=MX(t)MY(t)M_Z(t) = M_X(t) \cdot M_Y(t)
  3. 同定する:MZM_Z が既知の MGF と一致すれば ZZ の分布がわかる。

上の三つの例(二項分布・ポアソン分布・正規分布)はいずれも各分布の MGF が閉形式で知られているため、このアプローチで直ちに従う。

三つ以上の変数の畳み込み

nn 個の独立な変数 X1,,XnX_1, \ldots, X_n に対して、Sn=X1++XnS_n = X_1 + \cdots + X_n の分布は nn 重畳み込み fX1fX2fXnf_{X_1} * f_{X_2} * \cdots * f_{X_n} だ。その MGF は k=1nMXk(t)\prod_{k=1}^n M_{X_k}(t) だ。すべての XkX_k が MGF M(t)M(t) を持つ同一分布に従うとき、SnS_n の MGF は M(t)nM(t)^n だ。

中心極限定理はこの nn 重畳み込みに関する漸近的な命題だ:標準化後、M(t)nM(t)^n は(緩やかな条件のもとで)et2/2e^{t^2/2}、すなわち標準正規分布の MGF に収束する。

まとめ

  • 独立な X,YX, Y に対して Z=X+YZ = X + Y の分布は、それらの分布の畳み込みだ:fZ=fXfYf_Z = f_X * f_Y(密度の積分)または pZ(n)=kpX(k)pY(nk)p_Z(n) = \sum_k p_X(k) p_Y(n-k)(PMF の和)。
  • 閉包の結果Bin(m,p)+Bin(n,p)=Bin(m+n,p)\operatorname{Bin}(m,p) + \operatorname{Bin}(n,p) = \operatorname{Bin}(m+n,p)Poisson(λ)+Poisson(μ)=Poisson(λ+μ)\operatorname{Poisson}(\lambda) + \operatorname{Poisson}(\mu) = \operatorname{Poisson}(\lambda+\mu)N(μ1,σ12)+N(μ2,σ22)=N(μ1+μ2,σ12+σ22)\operatorname{N}(\mu_1,\sigma_1^2) + \operatorname{N}(\mu_2,\sigma_2^2) = \operatorname{N}(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2)Gamma(α,λ)+Gamma(β,λ)=Gamma(α+β,λ)\operatorname{Gamma}(\alpha,\lambda) + \operatorname{Gamma}(\beta,\lambda) = \operatorname{Gamma}(\alpha+\beta,\lambda)
  • 畳み込みは MGF の乗算に対応する:MX+Y=MXMYM_{X+Y} = M_X \cdot M_Y(MGF は分布のラプラス変換であるため)。
  • MGF を用いたアプローチ——計算・乗算・同定——は通常、畳み込み積分を直接評価するより速い。
  • i.i.d. 変数の nn 重畳み込みは、中心極限定理により標準化後に正規分布に収束する。