ベイズの公式

Essential
最終更新: タグ: Probability, Conditional Probability

前提知識

乗法定理は P(AB)=P(AB)P(B)=P(BA)P(A)P(A \cap B) = P(A \mid B) P(B) = P(B \mid A) P(A) を与える。ベイズの公式(Bayes’ formula)はこの対称性を利用して条件付き確率を反転させる:仮説 AiA_i のもとで観測データ BB がどれだけ起きやすいかが与えられたとき、データが得られた後の各仮説の確率を計算する。

設定

Ω\Omega の可算分割 {A1,A2,}\{A_1, A_2, \ldots\} で各 P(Ai)>0P(A_i) > 0 とする。AiA_i を競合する仮説と考える。与えられているのは:

  • 事前確率(prior probability)P(Ai)P(A_i)——BB を観測する前の不確実性。
  • 尤度(likelihood)P(BAi)P(B \mid A_i)——各仮説のもとでの観測 BB の起こりやすさ。

ベイズの公式は事後確率(posterior probability)P(AiB)P(A_i \mid B)——BB を観測した後の更新された不確実性——を計算する。

導出

AiBA_i \cap B に乗法定理を両方向に適用する:

P(BAi)P(Ai)=P(AiB)=P(AiB)P(B).P(B \mid A_i) \, P(A_i) = P(A_i \cap B) = P(A_i \mid B) \, P(B).

P(AiB)P(A_i \mid B) について解き、P(B)P(B)全確率の法則を代入する:

P(AiB)=P(BAi)P(Ai)P(B)=P(BAi)P(Ai)jP(BAj)P(Aj).(1)P(A_i \mid B) = \frac{P(B \mid A_i) \, P(A_i)}{P(B)} = \frac{P(B \mid A_i) \, P(A_i)}{\displaystyle\sum_j P(B \mid A_j) \, P(A_j)}. \tag{1}

これがベイズの公式だ。分母は事後確率 P(AiB)P(A_i \mid B) の和が 11 になるための規格化定数に過ぎない。

ベイズ的解釈

(1)(1) は比例の形

事後確率    尤度×事前確率\text{事後確率} \;\propto\; \text{尤度} \times \text{事前確率}

と読み取れる。各仮説の事前確率に、その仮説がデータをどれだけうまく説明するかを掛け合わせ、規格化する。分母 P(B)P(B)周辺尤度(marginal likelihood)またはエビデンスとも呼ぶ)はすべての仮説で共通なので、順位は変えずスケールのみ調整する。

この比例関係はベイズ推論(Bayesian inference)の基盤だ:パラメータに対する事前信念に観測データの尤度を掛けると事後信念が得られる。データが蓄積されるにつれて、正則条件のもとで事前分布によらず事後分布は真のパラメータに集中していく。

診断検査の例

この例は、基本率(base rate)が直感に反した答えをもたらすことを示す典型だ。

ある疾患が人口の1%に存在する。診断検査には次の性能がある:

  • 感度(sensitivity)P(+D)=0.99P(+ \mid D) = 0.99(真陽性率)。
  • 特異度(specificity)P(Dc)=0.99P(- \mid D^c) = 0.99、すなわち偽陽性率 P(+Dc)=0.01P(+ \mid D^c) = 0.01

無作為に選んだ人が陽性と判定された。その人が実際に疾患を持っている確率は?

分割 {D,Dc}\{D, D^c\} にベイズの公式を適用する:

P(D+)=P(+D)P(D)P(+D)P(D)+P(+Dc)P(Dc)=0.99×0.010.99×0.01+0.01×0.99=0.00990.0198=50%.P(D \mid +) = \frac{P(+ \mid D) \, P(D)}{P(+ \mid D) \, P(D) + P(+ \mid D^c) \, P(D^c)} = \frac{0.99 \times 0.01}{0.99 \times 0.01 + 0.01 \times 0.99} = \frac{0.0099}{0.0198} = 50\%.

精度99%の検査でも、有病率1%では事後確率はわずか50%だ。理由:疾患を持ち陽性になる人(約1%)と疾患を持たず陽性になる人(同じく約1%)が同程度存在するため、事前確率 P(D)=0.01P(D) = 0.01 が打ち消し合う。事前確率が50%から大きく外れると、基本率の影響は絶大だ。

有病率を10%(高リスク集団)に上げると:

P(D+)=0.99×0.100.99×0.10+0.01×0.90=0.0990.10891.7%.P(D \mid +) = \frac{0.99 \times 0.10}{0.99 \times 0.10 + 0.01 \times 0.90} = \frac{0.099}{0.108} \approx 91.7\%.

同じ検査でも、高リスク集団ではるかに多くの情報をもたらす。

まとめ

  • ベイズの公式P(AiB)=P(BAi)P(Ai)/jP(BAj)P(Aj)P(A_i \mid B) = P(B \mid A_i) P(A_i) \,/\, \sum_j P(B \mid A_j) P(A_j)——乗法定理を対称に適用し、全確率の法則で導出される。
  • ベイズ的読み方:事後確率 \propto 尤度 ×\times 事前確率;分母 P(B)P(B) はすべての仮説で共通の規格化定数だ。
  • 基本率への感度:精度の高い検査でも、事前確率(有病率)が非常に小さければ事後確率は低いまま——これが診断例の重要な教訓だ。