2014/08/07

ベイズの定理の基本的な解説

分野: データの分析,確率  レベル: 最難関大学

ベイズの定理:
$P(X)P(Y|X)=P(Y)P(X|Y)=P(X\cap Y)$

条件付き確率とベイズの定理の基本的な話です。

条件付き確率とベイズの定理の意味

ベイズの定理のベン図

$p(X)$:事象 $X$ が起きる確率$=\dfrac{|X|}{|U|}$
$P(Y|X)$:事象 $X$ が起きたもとで事象 $Y$ が起きる確率$=\dfrac{|A|}{|X|}$
($P_X(Y)$ と表記する流儀もあります。)

よって,「 $X$ も $Y$ も起きる確率」=「 $X$ が起きる確率」×「 $X$ が起きたもとで $Y$ が起きる確率」なので,
「 $P(X\cap Y)=P(X)P(Y|X)$ 」が成立します。
(ベン図で表すと,$\dfrac{|A|}{|U|}=\dfrac{|X|}{|U|}\cdot\dfrac{|A|}{|X|}$)

同様に $Y$ 側から考えることで
$P(X\cap Y)=P(Y)P(X|Y)$ が成立します。
(ベン図で表すと,$\dfrac{|A|}{|U|}=\dfrac{|Y|}{|U|}\cdot\dfrac{|A|}{|Y|}$)

このように両側から考えることによって恒等式
$P(X)P(Y|X)=P(Y)P(X|Y)$
が成立することが分かります。これがベイズの定理です。

「ベイズの定理はベン図の両側から攻めて $P(X\cap Y)$ を2通りの方法で表したもの」とみなせます。

ベイズの定理

上記の恒等式より $P(X),P(Y|X),P(Y),P(X|Y)$ のうち3つが分かれば残りの1つが分かります。
多くの場合は $P(X)$ や $P(Y)$ でなく条件付き確率を求めるのが目的となるので,
$P(Y|X)=\dfrac{P(Y)P(X|Y)}{P(X)}$

の形で使うことが多いです。そのためこれをベイズの定理と呼ぶことも多いです。
→ベイズ推定の簡単な例と利点

この形で書いた時に,
$P(Y)$ を事前確率
$P(Y|X)$ を事後確率
と呼びます。もともと $Y$ が起きる確率は事前確率 $P(Y)$ であったが,$X$ が起きるという情報を得た元では事後確率 $P(Y|X)$ になる,というニュアンスです。

ベイズの定理は統計学の基本的な定理で名前と雰囲気くらいは教養として知っておくべきですが,入試で知っておくと有利になるような場面はほとんどないと思います。

ベイズの定理を用いる入試問題

ベイズの定理を用いる入試問題を探したけど見つかりませんでした,知っている方はご一報くださいm(__)m

ちなみに以下の問題をベイズの定理と応用例として紹介しているサイトが複数ありましたが,単純に条件付き確率の問題です。わざわざベイズの定理を持ち出す必要はありません。

大昔の早稲田の入試問題:
5回に1回の割合で帽子を忘れるくせのあるK君が正月に $A,B,C$ の3軒を順に訪問して家に帰ったとき、帽子を忘れてきたことに気がついた。2軒目の家 $B$ に忘れてきた確率を求めよ。

解答

$X$ を帽子を忘れるという事象
$Y$ を帽子を家 $B$ に忘れるという事象とする。

求める確率は $P(Y|X)=\dfrac{P(X\cap Y)}{P(X)}$
(条件付き確率の定義)

$P(X)$ は帽子をどこかに忘れる確率:
$\dfrac{1}{5}+\dfrac{4}{5}\cdot\dfrac{1}{5}+\dfrac{4}{5}\cdot\dfrac{4}{5}\cdot\dfrac{1}{5}=\dfrac{61}{125}$

$P(X\cap Y)$ は帽子を家 $B$ に忘れる確率:
$\dfrac{4}{5}\cdot\dfrac{1}{5}=\dfrac{4}{25}$

よって求める確率は
$\dfrac{4}{25}÷\dfrac{61}{125}=\dfrac{20}{61}$

なお,条件付き確率については条件付き確率の意味といろいろな例題もどうぞ。

ベイズの定理の統計学への応用はかなり奥が深いです。
分野: データの分析,確率  レベル: 最難関大学