この講座の対象者は以下の方を想定しています。
- 数学は中学レベルしか分からないけど統計検定2級に合格したい
- どの参考書を見ても数式だらけで理解できない
- ベイズの定理って何なの?
この講座では特に、0の状態から統計検定2級に合格したいって方のために、分かりやすさをモットーに解説していきます。
今回は何かと聞いた事があるベイズの定理。その内容は少し複雑ですが、非常に考えられた定理であるため、統計学だけでは無くビジネスにおいても重要です。
ベイズの定理

ベイズの定理を簡単に説明すると、$P(A|B)$は、$P(B|A)$と$P(A)$の積を$P(B)$で割る事で求められます。
これだけ聞いても全く理解できませんね、、
実際に例題を見ながら意味を理解するのが一番です。
ベイズの定理は、トーマス・ベイズ牧師にちなんで名付けられました。ベイズは、18世紀のイギリスの数学者であり、確率論の研究において重要な貢献をした人です。
ベイズの定理の式
$P(A|B)=\frac{P(B|A)P(A)}{P(B)}$
これがベイズの定理です。
各記号の意味のおさらいをしておきましょう。
- $P(B|A)$ は、事象 B が事象 A の条件下で起こる確率。$P_A(B)$と一緒です。
- $P(A|B)$ は、事象 A が事象 B の条件下で起こる確率。$P_B(A)$と一緒です。
- $P(A)$ は、事象 A が起こる確率
- $P(B)$ は、事象 B が起こる確率
ベイズの定理は、事前の知識である P(A) と、新しい情報である P(B|A) を用いて、事象 A が起こる確率である P(A|B) を求めることができます。
ちなみにベイズの定理は条件付確率を少し変形させたものです。
条件付確率:$P(A|B)=\frac{P(A \cap B)}{P(B)}$
ベイズの定理:$P(A|B)=\frac{P(B|A)P(A)}{P(B)}$
まだイマイチ理解出来ないと思うので、例題をもとに理解を深めましょう!
ベイズの定理の例題
ある製品をA社から20%、B社から80%仕入れていた。
A社の不良品率は20%で、B社の不良品率は3%である。
無作為に選んだ製品が不良品である場合、これがA社の製品である確率は?
まず、事象AとBを整理します。
- 事象A:A社の製品である
- 事象B:不良品である
事象Aの確率は問題文から0.2であることが分かりますね。
またA社の製品であるという条件のもとで、不良品である確率は、$0.2×0.2$で求められます。
B社の製品であるという条件のもとで、不良品である確率は、$0.8×0.03$で求められます。
これらの情報から、$P(B)$の「無作為に選んだ製品が不良品である確率」は↓の式で求められます。
$P(B)=0.2×0.2+0.8×0.03=0.064$
あとは、$P(B|A)P(A)$が分かれば良さそうです。
これは、A社の製品かつ不良品である確率ですので、
$P(B|A)P(A)=0.2×0.2=0.04$
ですね。最後にこれを公式に当てはめます。
$P(A|B)=\frac{P(B|A)P(A)}{P(B)}$
$P(A|B)=\frac{0.2×0.2}{0.2×0.2+0.8×0.03}$
$=\frac{0.04}{0.064}=0.625$
このように、無作為に選んだ製品が不良品である場合、これがA社の製品である確率は$0.625$という事が分かりました。
長かったので、大変と思われるかもしれませんが、やっている事は簡単です。
$\frac{A社の不良品率×A社の割合}{A社の不良品率×A社の割合+B社の不良品率×B社の割合}$
これをしているだけです。
また、これがC社、D社….と続いても、
$\frac{A社の不良品率×A社の割合}{A社の不良品率×A社の割合+B社の不良品率×B社の割合+C社の不良品率×C社の割合…..}$
としていけば良いだけなので、これが理解できていればどんな問題も解けます。
事前確率と事後確率と尤度(ゆうど)
ベイズの定理をより深く理解する上で重要になってくるのが以下の3つの単語です。
- 事前確率
- 事後確率
- 尤度(ゆうど)
尤度以外は字の意味そのままですので、簡単です。
ここから先は機械学習でより重要になってくる内容です。
今回の講義のスコープはあくまで統計検定2級ですので、説明は簡単に行います。
事前確率
事前確率とは、データが得られる前の事前の確率です。
そのままですね。
$P(A|B)=\frac{P(B|A)P(A)}{P(B)}$
このベイズの定理の$P(A)$の部分が事前確率に当たります。
例題ですと、A社の製品割合ですので、事前に分かっていますね。
尤度(ゆうど)
尤度は定理では$P(B|A)$に当たる部分です。
事象Aという条件のもとで事象Bが起こる確率の事でしたね。
例題では、A社の製品かつ不良品である確率ですね。
$P(B|A)=0.2$
事後確率
これは$P(A|B)$のことです。
無作為に選んだひとつが不良品だった場合、それがA社のものである確率でした。
例題の答えの部分です。
$P(A|B)=0.625$
でした。
このように、事象Bが起きた後の事象Aの確率ですので事後確率です。
練習問題
①
袋 | 赤玉 | 白玉 |
A | 3 | 2 |
B | 1 | 4 |
C | 2 | 3 |
答え:0.5
- 事象A:袋Aのものである
- 事象B:赤玉である
このようになります。
$P(A|B)=\frac{P(B|A)P(A)}{P(B)}$
次に定理の$P(B)$を求めます。
袋の選ばれる確率均等なので$\frac{1}{3}$を各袋の赤玉が選ばれる確率と掛け合わせ、足していきます。
$P(B)=\frac{3}{5}×\frac{1}{3}+\frac{1}{5}×\frac{1}{3}+\frac{2}{5}×\frac{1}{3}=\frac{6}{15}$
次に$P(B|A)P(A)$を求めます。
$P(B|A)P(A)=\frac{3}{5}×\frac{1}{3}=\frac{3}{15}$
ではこれを定理に当てはめます。
$P(A|B)=\frac{\frac{3}{15}}{\frac{6}{15}}=\frac{1}{2}=0.5$
②
続いて超有名な問題です。
答え:0.0004898
- 事象A:病気に羅漢している
- 事象B:陽性と診断される
と置くことで↓の式から計算する事ができます。
$P(A|B)=\frac{P(B|A)P(A)}{P(B)}$
$P(A|B)=\frac{0.0001×0.98}{0.0001×0.98+0.9999×0.2}$
$=\frac{0.000098}{0.200078}=0.0004898……$
実際には陽性と診断されても本当に羅漢している確率は0.048%ですので非常に低いです。
Work illustrations by Storyset