1 秒あたりの放射性崩壊事象、1 ページあたりの誤字、1 分あたりのサーバーリクエスト——固定された窓内で希な独立事象が何回起きるかを数えるとき、ポアソン分布が自然なモデルだ。
ポアソンの極限
ポアソンの PMF を導出する最もすっきりした方法は、二項分布の極限をとることだ。固定された窓内で平均 λ>0 個の事象が起きるとしよう。窓を n 個の等しい部分区間に分割し、各区間は十分短くて高々 1 個の事象しか落ちないとする。任意の一区間で事象が起きる確率はおよそ p=λ/n であり、すべての区間は独立だ。
事象の数は Bin(n,λ/n) になる。k を固定して n→∞ とすると:
P(X=k)=(kn)(nλ)k(1−nλ)n−k.
各因子を順に展開する。
二項係数:
(kn)=k!n(n−1)⋯(n−k+1)→k!nk(n→∞ のとき),
k は固定で n が増えるため、k 個の因子 (n−j)/n はいずれも 1 に収束する。
p の冪:
(nλ)k=nkλk.
裾の因子:
(1−nλ)n−k=(1−nλ)n⋅(1−nλ)−k→e−λ⋅1=e−λ,
標準的な極限 limn→∞(1−λ/n)n=e−λ と (1−λ/n)−k→1 を使う。
まとめると:
P(X=k)→k!nk⋅nkλk⋅e−λ=k!e−λλk.
定義
確率変数 X がレート λ>0 のポアソン分布(Poisson distribution)に従うとき X∼Poisson(λ) と書き、その PMF は:
P(X=k):=k!e−λλk,k=0,1,2,…
検証:PMF の和が 1 になること
k=0∑∞k!e−λλk=e−λk=0∑∞k!λk=e−λ⋅eλ=1.✓
∑k=0∞λk/k!=eλ は指数関数のテイラー展開だ。
平均:E[X]=λ
E[X]=k=0∑∞kk!e−λλk.
k=0 の項はゼロだ。k≥1 では k を k! で消すと:
E[X]=e−λk=1∑∞(k−1)!λk=e−λ⋅λj=0∑∞j!λj=e−λ⋅λ⋅eλ=λ.
平均はレートパラメータに等しい——λ の定め方を考えれば当然の結果だ。
分散:Var(X)=λ
まず E[X(X−1)] を計算する:
E[X(X−1)]=k=2∑∞k(k−1)k!e−λλk=e−λλ2j=0∑∞j!λj=λ2.
したがって E[X2]=E[X(X−1)]+E[X]=λ2+λ となり:
Var(X)=E[X2]−(E[X])2=(λ2+λ)−λ2=λ.
ポアソン確率変数の平均と分散はいずれも λ に等しい。この等式は有用な診断基準だ:カウントデータを観測して標本平均と標本分散が大きく異なる場合、ポアソンモデルは合わない可能性がある。
加法的性質
X∼Poisson(λ1) と Y∼Poisson(λ2) が独立ならば:
X+Y∼Poisson(λ1+λ2).
証明。 畳み込みの公式から:
P(X+Y=k)=j=0∑kP(X=j)P(Y=k−j)=j=0∑kj!e−λ1λ1j⋅(k−j)!e−λ2λ2k−j.
e−(λ1+λ2)/k! を括り出して二項定理を適用すると:
P(X+Y=k)=k!e−(λ1+λ2)j=0∑k(jk)λ1jλ2k−j=k!e−(λ1+λ2)(λ1+λ2)k.□
この加法性は物理的な直観を反映している:レート λ1 と λ2 の二つの独立なポアソン過程から事象が到来するとき、合成された流れはレート λ1+λ2 のポアソン過程になる。
まとめ
- X∼Poisson(λ) は n→∞ のときの Bin(n,λ/n) の極限であり、固定された窓内の希な独立事象のカウントをモデル化する。
- PMF: P(X=k)=e−λλk/k!(k=0,1,2,…)。
- 平均と分散はいずれも λ に等しい。
- 加法性: 独立な Poisson(λ1) と Poisson(λ2) の和は Poisson(λ1+λ2)。