乗法定理は P(A∩B)=P(A∣B)P(B)=P(B∣A)P(A) を与える。ベイズの公式(Bayes’ formula)はこの対称性を利用して条件付き確率を反転させる:仮説 Ai のもとで観測データ B がどれだけ起きやすいかが与えられたとき、データが得られた後の各仮説の確率を計算する。
設定
Ω の可算分割 {A1,A2,…} で各 P(Ai)>0 とする。Ai を競合する仮説と考える。与えられているのは:
- 事前確率(prior probability)P(Ai)——B を観測する前の不確実性。
- 尤度(likelihood)P(B∣Ai)——各仮説のもとでの観測 B の起こりやすさ。
ベイズの公式は事後確率(posterior probability)P(Ai∣B)——B を観測した後の更新された不確実性——を計算する。
導出
Ai∩B に乗法定理を両方向に適用する:
P(B∣Ai)P(Ai)=P(Ai∩B)=P(Ai∣B)P(B).
P(Ai∣B) について解き、P(B) に全確率の法則を代入する:
P(Ai∣B)=P(B)P(B∣Ai)P(Ai)=j∑P(B∣Aj)P(Aj)P(B∣Ai)P(Ai).(1)
これがベイズの公式だ。分母は事後確率 P(Ai∣B) の和が 1 になるための規格化定数に過ぎない。
ベイズ的解釈
式 (1) は比例の形
事後確率∝尤度×事前確率
と読み取れる。各仮説の事前確率に、その仮説がデータをどれだけうまく説明するかを掛け合わせ、規格化する。分母 P(B)(周辺尤度(marginal likelihood)またはエビデンスとも呼ぶ)はすべての仮説で共通なので、順位は変えずスケールのみ調整する。
この比例関係はベイズ推論(Bayesian inference)の基盤だ:パラメータに対する事前信念に観測データの尤度を掛けると事後信念が得られる。データが蓄積されるにつれて、正則条件のもとで事前分布によらず事後分布は真のパラメータに集中していく。
診断検査の例
この例は、基本率(base rate)が直感に反した答えをもたらすことを示す典型だ。
ある疾患が人口の1%に存在する。診断検査には次の性能がある:
- 感度(sensitivity)P(+∣D)=0.99(真陽性率)。
- 特異度(specificity)P(−∣Dc)=0.99、すなわち偽陽性率 P(+∣Dc)=0.01。
無作為に選んだ人が陽性と判定された。その人が実際に疾患を持っている確率は?
分割 {D,Dc} にベイズの公式を適用する:
P(D∣+)=P(+∣D)P(D)+P(+∣Dc)P(Dc)P(+∣D)P(D)=0.99×0.01+0.01×0.990.99×0.01=0.01980.0099=50%.
精度99%の検査でも、有病率1%では事後確率はわずか50%だ。理由:疾患を持ち陽性になる人(約1%)と疾患を持たず陽性になる人(同じく約1%)が同程度存在するため、事前確率 P(D)=0.01 が打ち消し合う。事前確率が50%から大きく外れると、基本率の影響は絶大だ。
有病率を10%(高リスク集団)に上げると:
P(D∣+)=0.99×0.10+0.01×0.900.99×0.10=0.1080.099≈91.7%.
同じ検査でも、高リスク集団ではるかに多くの情報をもたらす。
まとめ
- ベイズの公式:P(Ai∣B)=P(B∣Ai)P(Ai)/∑jP(B∣Aj)P(Aj)——乗法定理を対称に適用し、全確率の法則で導出される。
- ベイズ的読み方:事後確率 ∝ 尤度 × 事前確率;分母 P(B) はすべての仮説で共通の規格化定数だ。
- 基本率への感度:精度の高い検査でも、事前確率(有病率)が非常に小さければ事後確率は低いまま——これが診断例の重要な教訓だ。