ベイズの公式 — Project Hematite

乗法定理は $P(A \cap B) = P(A \mid B) P(B) = P(B \mid A) P(A)$ を与える。ベイズの公式（Bayes’ formula）はこの対称性を利用して条件付き確率を反転させる：仮説 $A_i$ のもとで観測データ $B$ がどれだけ起きやすいかが与えられたとき、データが得られた後の各仮説の確率を計算する。

設定

$\Omega$ の可算分割 $\{A_1, A_2, \ldots\}$ で各 $P(A_i) > 0$ とする。 $A_i$ を競合する仮説と考える。与えられているのは：

事前確率（prior probability） $P(A_i)$ —— $B$ を観測する前の不確実性。
尤度（likelihood） $P(B \mid A_i)$ ——各仮説のもとでの観測 $B$ の起こりやすさ。

ベイズの公式は事後確率（posterior probability） $P(A_i \mid B)$ —— $B$ を観測した後の更新された不確実性——を計算する。

導出

$A_i \cap B$ に乗法定理を両方向に適用する：

P(B \mid A_i) \, P(A_i) = P(A_i \cap B) = P(A_i \mid B) \, P(B).

$P(A_i \mid B)$ について解き、 $P(B)$ に全確率の法則を代入する：

P(A_i \mid B) = \frac{P(B \mid A_i) \, P(A_i)}{P(B)} = \frac{P(B \mid A_i) \, P(A_i)}{\displaystyle\sum_j P(B \mid A_j) \, P(A_j)}. \tag{1}

これがベイズの公式だ。分母は事後確率 $P(A_i \mid B)$ の和が $1$ になるための規格化定数に過ぎない。

ベイズ的解釈

式 $(1)$ は比例の形

\text{事後確率} \;\propto\; \text{尤度} \times \text{事前確率}

と読み取れる。各仮説の事前確率に、その仮説がデータをどれだけうまく説明するかを掛け合わせ、規格化する。分母 $P(B)$ （周辺尤度（marginal likelihood）またはエビデンスとも呼ぶ）はすべての仮説で共通なので、順位は変えずスケールのみ調整する。

この比例関係はベイズ推論（Bayesian inference）の基盤だ：パラメータに対する事前信念に観測データの尤度を掛けると事後信念が得られる。データが蓄積されるにつれて、正則条件のもとで事前分布によらず事後分布は真のパラメータに集中していく。

診断検査の例

この例は、基本率（base rate）が直感に反した答えをもたらすことを示す典型だ。

ある疾患が人口の1%に存在する。診断検査には次の性能がある：

感度（sensitivity） $P(+ \mid D) = 0.99$ （真陽性率）。
特異度（specificity） $P(- \mid D^c) = 0.99$ 、すなわち偽陽性率 $P(+ \mid D^c) = 0.01$ 。

無作為に選んだ人が陽性と判定された。その人が実際に疾患を持っている確率は？

分割 $\{D, D^c\}$ にベイズの公式を適用する：

P(D \mid +) = \frac{P(+ \mid D) \, P(D)}{P(+ \mid D) \, P(D) + P(+ \mid D^c) \, P(D^c)} = \frac{0.99 \times 0.01}{0.99 \times 0.01 + 0.01 \times 0.99} = \frac{0.0099}{0.0198} = 50\%.

精度99%の検査でも、有病率1%では事後確率はわずか50%だ。理由：疾患を持ち陽性になる人（約1%）と疾患を持たず陽性になる人（同じく約1%）が同程度存在するため、事前確率 $P(D) = 0.01$ が打ち消し合う。事前確率が50%から大きく外れると、基本率の影響は絶大だ。

有病率を10%（高リスク集団）に上げると：

P(D \mid +) = \frac{0.99 \times 0.10}{0.99 \times 0.10 + 0.01 \times 0.90} = \frac{0.099}{0.108} \approx 91.7\%.

同じ検査でも、高リスク集団ではるかに多くの情報をもたらす。

まとめ

ベイズの公式： $P(A_i \mid B) = P(B \mid A_i) P(A_i) \,/\, \sum_j P(B \mid A_j) P(A_j)$ ——乗法定理を対称に適用し、全確率の法則で導出される。
ベイズ的読み方：事後確率 $\propto$ 尤度 $\times$ 事前確率；分母 $P(B)$ はすべての仮説で共通の規格化定数だ。
基本率への感度：精度の高い検査でも、事前確率（有病率）が非常に小さければ事後確率は低いまま——これが診断例の重要な教訓だ。