この講座の対象者は以下の方を想定しています。
- 数学は中学レベルしか分からないけど統計検定2級に合格したい
- どの参考書を見ても数式だらけで理解できない
- 二項分布って何?
- 確率分布が苦手
この講座では特に、0の状態から統計検定2級に合格したいって方のために、分かりやすさをモットーに解説していきます。
今回は、確率分布の中でも重要になってくる二項分布についてです。
是非最後までご覧ください。
二項分布の概要

二項分布は、結果が成功か失敗のいずれかである試行を独立に n 回行ったときの成功回数を確率変数$X$とする離散確率分布です。
ただし、各試行における成功確率$P$は一定とします。
例えば、以下の様な場面をイメージすると分かりやすいと思います。
- コインを投げて表が出る回数を調べる
- サイコロを振って偶数が出る回数を調べる
- アンケートに答えた人の何人が「はい」と答えたかを調べる
ベルヌーイ試行
まず覚えて欲しい専門用語として、ベルヌーイ試行があります。
これは、「コインを投げたときに表か裏か?」のように、起こる結果が2つしかない試行のことです。
そして、このベルヌーイ試行を$n$回行って、成功する回数$X$が従う確率分布を二項分布と言います。
$n$回のベルヌーイ試行を行い、$k$回成功する確率は以下の式から求められます。
つまり$X=k$となるです。
$P(X=k)={}_n C_kp^k(1-p)^{n-k}$
例題
では実際に例題をやってみましょう。
コインを5回投げて、表が3回でる確率を求めよ。
まず問題分から公式にある各記号を整理します。
- $n$:5回試行を行う
- $k$:3回表がでる(成功)
- $p$:コインなので成功確率は$\frac{1}{2}$
これを公式に当てはめると↓になります。
$P(X=3)={}_5 C_3×0.5^3×(1-0.5)^{5-3}$
$=10×0.125×0.25=0.3125$…答え
二項分布表
コインを5回投げたとき、表がでる回数は[0, 1, 2, 3, 4, 5]のどれかになりますよね?
それぞれの表が出る回数の確率分布を表したのが↓の表になります。
$X$が表が出る回数で、$P$はその確率です。
$X$ | 0回 | 1回 | 2回 | 3回 | 4回 | 5回 |
$P$ | 0.03125 | 0.15625 | 0.3125 | 0.3125 | 0.15625 | 0.03125 |
このような分布が二項分布です。
ちなみに注意点として、0回を計算する時に、${}_5 C_0$や$0.5^0$がでてきますが、それぞれの計算結果は1になる事に注意してください。
このような二項分布は↓の記号で表します。
$B(n, p)$
$n$が回数で、$p$が確率ですね。
上記の二項分布表を記号で表すと、$B(5, 0.5)$になります。
二項分布の期待値と分散
二項分布でも期待値と分散は↓の式で求める事ができます。
- 期待値:$E(X)=np$
- 分散:$V(X)=np(1-p)$
非常に簡単に求められますね。
期待値の求め方
では実際に期待値を求めてみましょう。
先ほどの二項分布$B(5, 0.5)$で求めてみます。
$E(X)=np=5×0.5=2.5$
$E(X)=2.5$
このように期待値は2.5だと分かりました。
分散の求め方
では続いて分散です。
$V(X)=np(1-p)=5×0.5×(1-0.5)=1.25$
$V(X)=1.25$
このような結果になりました。
ポワソン分布
今までは、コインをメインに話していたので確率は$\frac{1}{2}$でした。
しかし、二項分布だからといって全てが確率$\frac{1}{2}$というわけではありません。
$\frac{1}{4}$、$\frac{1}{10}$の場合もありますし、確率$p$が非常に小さい場合もあります。
そんな確率が非常に小さい場合に使うのがポワソン分布です。
ポワソン分布の例題
例えばですが、↓の問題を考えましょう。
ある道路にて事故が起きる確率が0.00001です。1日に10,000台の車がこの道を使う場合、1年間(365日)に1回事故が起きる確率を求めよ。
まず、二項分布の公式を使って求めます。
- $n=3650000$…1日に10,000台×365日です。
- $p=0.00001$
- $k=1$
となりますね。これを公式に当てはめると↓になります。
$P(X=k)={}_{3650000} C_1×0.00001^1×(1-0.00001)^{3650000-1}$
$=0.99999^{3649999}$
このように、とんでもないほどの累乗を計算しないといけなくなるので、現実的ではありません。
そんな時にポワソン分布を使います。
ポワソン分布の公式
このように、$n$が非常に大きく、$p$が非常に小さい場合には、$E(X)=np=λ$のポワソン分布に近似的に従います。
$P(X=k)=\frac{λ^k}{k!}e^{-λ}$
$e$はネイピア数です。
円周率のようなものだと思ってください。$2.7182818…$と無限に続きます。
例えば↓の問題を解いてみましょう。
A社の製品は1000個に一個の割合で不良品が発生する。
A社が5000個の製品を作った時に、不良品が2個になる確率を求めよ。
公式に当てはめるために必要な情報をまとめましょう。
$λ$は期待値である$n×p$をすれば求められます。
$n$は5000で$p$は$\frac{1}{1000}$ですね。
- $λ=np=5000×\frac{1}{1000}=5$
- $k=2$
- $e=2.7182818$
これをもとに公式に当てはめて考えてみます。
$P(X=k)=\frac{λ^k}{k!}e^{-λ}$
$=\frac{5^2}{2!}×e^{-5}$
$=12.5×0.00673794699=0.08422…$…答え
約8%の確率だという事が分かりましたね!
このように、ポワソン分布を使うと二項分布よりもシンプルに計算する事ができます。
二項分布との違いは$n$や$p$が分からなくても使えるという点です。
「ある事象が起こる平均回数」である$λ$さえ分かっていれば、ポアソン分布から確率を算出することができます。
ポワソン分布の期待値と分散
ポワソン分布の期待値と分散は非常にシンプルです。
- $E(X)=λ$
- $V(X)=λ$
このように$λ$がそのまま期待値と分散になっています。
練習問題
①
答え:0.138
あたりとはずれしかない試行ですのでベルヌーイ試行ですね。また複数回実施するので二項分布で求められます。
二項分布は↓の式で求められます。
$P(X=k)={}_n C_kp^k(1-p)^{n-k}$
$P(X=2)={}_{5}C_2×(\frac{15}{100})^2×(1-\frac{15}{100})^{5-2}$
$=10×0.0225×0.614125=0.1381178125$
②
答え:期待 100 分散 99
不良品の個数を$X$とおきます。$X$は二項分布$B(10000, \frac{1}{100})$にしたがうので、以下の公式を使って求められます。。
- 期待値:$E(X)=np$
- 分散:$V(X)=np(1-p)$
$E(X)=10000×\frac{1}{100}=100$
$V(X)=10000×\frac{1}{100}×(1-\frac{1}{100})$
$=100×\frac{99}{100}=99$
Work illustrations by Storyset