ベルヌーイ分布 — Project Hematite

ベルヌーイ分布は最もシンプルな非自明な確率変数だ：成功か失敗かのどちらかに終わる単一の二値試行。より複雑なすべての離散分布——二項分布・幾何分布・負の二項分布——は直接これの上に構築される。

定義

確率変数 $X$ がパラメータ $p \in [0, 1]$ のベルヌーイ分布（Bernoulli distribution）に従うとき、 $X \sim \text{Bernoulli}(p)$ と書き、 $X$ は $0$ と $1$ のみの値をとり

P(X = 1) = p, \qquad P(X = 0) = 1 - p

を満たす。値 $1$ は慣習上成功、 $0$ は失敗と呼ばれる。単一パラメータ $p$ は成功確率だ。

二つの場合を一つの式にまとめると：

P(X = k) = p^k (1-p)^{1-k}, \qquad k \in \{0, 1\}.

累積分布関数（CDF：cumulative distribution function）は区分的に定数だ：

F(x) \coloneqq P(X \le x) = \begin{cases} 0 & x < 0, \\ 1 - p & 0 \le x < 1, \\ 1 & x \ge 1. \end{cases}

$X$ の期待値は、離散確率変数の期待値の定義から直接求まる：

E[X] = 0 \cdot P(X = 0) + 1 \cdot P(X = 1) = 0 \cdot (1-p) + 1 \cdot p = p.

したがって $E[X] = p$ ：平均は成功確率そのものだ。

$\text{Var}(X) = E[X^2] - (E[X])^2$ を計算するには、まず $X \in \{0, 1\}$ なので $X^2 = X$ が成り立ち、 $E[X^2] = E[X] = p$ となることに注目する。したがって

\text{Var}(X) = p - p^2 = p(1-p).

分散は $p = \tfrac{1}{2}$ （最大の不確実性）で最大となり、 $p = 0$ または $p = 1$ （結果が確定）でゼロに崩壊する。

$X$ のモーメント母関数（MGF：moment generating function）は

M(t) \coloneqq E[e^{tX}] = e^{t \cdot 0}(1-p) + e^{t \cdot 1} p = (1 - p) + p e^t.

このコンパクトな表現により、 $n$ 個の独立なコピーを掛け合わせることで二項分布の MGF を直接導出できる。