実験が同じ二値試行を何度も繰り返すとき——コインを投げる、製造部品を検査する、アンケートの回答を集める——自然な問いは「成功は何回起きるか?」だ。二項分布はまさにこの問いに答える。
設定
整数 n≥1 と確率 p∈[0,1] を固定する。n 回の独立な ベルヌーイ(p) 試行を行い、X を成功の総数とする。形式的には X1,X2,…,Xn を各 Xi∼Bernoulli(p) の独立な確率変数として
X:=X1+X2+⋯+Xn
と定義する。X∼Binomial(n,p)、または X∼Bin(n,p) と書く。
PMF の導出
X は {0,1,…,n} に値をとる。P(X=k) を求めるには、n 回の試行でちょうど k 回成功する場合の数を数える。
組み合わせ論的議論。 k 回成功 n−k 回失敗の特定の順序は、独立性より確率 pk(1−p)n−k で起きる。n 回のうちどの k 回が成功かを選ぶ順序の数は (kn) だ。すべての順序について足し合わせると確率質量関数(PMF:probability mass function)が得られる:
P(X=k)=(kn)pk(1−p)n−k,k=0,1,…,n.
∑k=0n(kn)pk(1−p)n−k=(p+(1−p))n=1(二項定理)なので、これは正当な PMF だ。
平均
期待値の線形性を使えば、PMF から直接計算しなくても済む。X=∑i=1nXi という表現と各 ベルヌーイ指示変数 E[Xi]=p を用いると:
E[X]=i=1∑nE[Xi]=np.
独立性は不要——線形性は無条件に成り立つ。
分散
ここでは Xi の独立性が必要だ。指示変数が独立なので分散が加算される:
Var(X)=i=1∑nVar(Xi)=n⋅p(1−p)=np(1−p).
加法的性質
定理。 X∼Bin(m,p) と Y∼Bin(n,p) が独立ならば
X+Y∼Bin(m+n,p).
MGF による証明。 X∼Bin(m,p) の MGF は m 個の独立なベルヌーイ MGF を掛け合わせて得られる:
MX(t)=((1−p)+pet)m.
同様に MY(t)=((1−p)+pet)n だ。X と Y が独立なので和の MGF は因数分解される:
MX+Y(t)=MX(t)⋅MY(t)=((1−p)+pet)m+n,
これは Bin(m+n,p) の MGF だ。MGF が分布を一意に決定するので結果が従う。□
直観。 m 回の独立なベルヌーイ試行の後に n 回の独立なベルヌーイ試行を行うことは——すべて同じ p で——m+n 回を一度に行うことと区別がつかない。
まとめ
- X∼Bin(n,p) は n 回の独立な ベルヌーイ(p) 試行の成功数を数える。
- PMF:P(X=k)=(kn)pk(1−p)n−k(k=0,1,…,n)。
- 平均:E[X]=np(期待値の線形性による)。
- 分散:Var(X)=np(1−p)(指示変数の独立性による)。
- MGF:M(t)=((1−p)+pet)n。
- 加法的:独立な Bin(m,p) と Bin(n,p) の和は Bin(m+n,p)。