この講座の対象者は以下の方を想定しています。
- 数学は中学レベルしか分からないけど統計検定2級に合格したい
- どの参考書を見ても数式だらけで理解できない
- 幾何分布って何?
- 確率分布が苦手
この講座では特に、0の状態から統計検定2級に合格したいって方のために、分かりやすさをモットーに解説していきます。
今回は、確率分布の中でも見落とされがちな幾何分布について解説します。
今回の内容は二項分布が分かっていないと難しいと思いますので、前回の講座がまだって方は「二項分布とは?」こちらの講座を先にどうぞ!
幾何分布とは?

前回ベルヌーイ試行を習ったのですが覚えているでしょうか?
「コインを投げたときに表か裏か?」のように、起こる結果が2つしかない試行のことです。
これがベルヌーイ試行です。
このベルヌーイ試行を繰り返し行い、初めて成功するまでの試行回数$X$が従う離散確率分布を幾何分布と言います。
幾何分布の例
- サイコロを投げて、$n$回目で初めて1が出る確率
- コインを投げて、$n$回目で初めて表が出る確率
- じゃんけんをして、$n$回目で勝負がつく確率
このような場合があげられます。
幾何分布の公式
成功確率を$p$とし、$k$回目で初めて成功する確率は以下の式から求める事ができます。
$P(X=k) = p(1-p)^{k-1}$
では実際に例題をもとに確率を求めてみましょう。
サイコロを連続して投げる時、5回目で初めて1がでる確率はいくらか?
まずは問題文から要点を整理すると、
- $p$はサイコロの1の目が出る確率なので$\frac{1}{6}$
- $k$は$5$
以上の点を、公式に当てはめて計算してみます。
$p(X=5)=\frac{1}{6}(1-\frac{1}{6})^{5-1}$
$=\frac{1}{6}×(\frac{5}{6})^4$
$=\frac{1}{6}×\frac{625}{1296}=0.080…..$…答え
この様にして、5回目で初めて1が出る確率は8%という事が分かりました。
ちなみに同じ様にして、1~6回目に初めて1がでる確率を表にしたのが↓です。
$k$ | 1回目 | 2回目 | 3回目 | 4回目 | 5回目 | 6回目 |
$p$ | 0.167 | 0.139 | 0.116 | 0.096 | 0.080 | 0.067 |
こうして表にしてみると、1回目に1が出る確率が一番高く、以降順々に確率が下がっていくのが分かりますね。
幾何分布の期待値と分散
幾何分布の期待値と分散は以下の式で求める事ができます。
- 期待値:$E(X)=\frac{1}{p}$
- 分散:$V(X)=\frac{1-p}{p^2}$
幾何分布の期待値の求め方
では実際に期待と値を求めてみましょう。
先ほどのサイコロを例にすると↓になります。
$E(X)=\frac{1}{\frac{1}{6}}=\frac{1×6}{1×1}=6$
まずサイコロの期待値は$6$だという事が分かりました。
幾何分布の分散の求め方
続いて分散の求め方を見ていきましょう。
同じくサイコロの例をもとに計算します。
$V(X)=\frac{1-p}{p^2}=\frac{1-\frac{1}{6}}{\frac{1}{6}^2}$
$=\frac{\frac{5}{6}}{\frac{1}{36}}=\frac{5×36}{6×1}$
$=30$…分散
幾何分布の無記憶性
無記憶性とはそれまでの結果が後の結果に影響を与えない事です。
例えば、サイコロで5回連続1が出たからといって、次に1が出る確率に変動があるわけではありません。
確率が$\frac{1}{6}$であることは、それまでの結果がなんであれ影響する事は無いのです。
超幾何分布
超幾何分布は、有限個の物体から無作為に抽出した物体の個数を記述する離散確率分布です。
超幾何分布は、抽出する物体の個数、抽出する物体の総数、抽出する物体の種類数によって決まります。
何を言ってるのか良く分からないですね~!
例えば、AとB、2つの種類で構成される$N$個からなる集団があります。
その時、Aが$k$個、Bが$N-k$個であるとします。
この集団から取り出された$n$個の中に含まれるAの個数が従う確率分布を超幾何分布というのです。
超幾何分布の公式
まずは、以下の式を使う事で超幾何分布の確率を求める事ができます。
$P(x)=\frac{{}_k C_x×{}_{N-k}C_{n-x}}{{}_NC_n}$
例えば、以下の問題を考えます。
10個のボールの中に、赤いボールが3個、青いボールが7個あります。
この中から3個のボールを無作為に抽出したとき、赤いボールが2個抽出される確率を求めよ。
まずは記号を整理しましょう。
- $N$:総数ですので10です。
- $k$:赤いボールをAとすると3。
- $N-k$:総数から赤いボールの数を引いて7。青いボールの数。
- $n$:無作為に抽出した3
- $x$:求める確率の2。
この様になります。
これを公式に当てはめて解いてみましょう。
$P(x)=\frac{{}_{3}C_2×{}_{10-3}C_{3-2}}{{}_{10} C_3}$
$=\frac{{}_{3}C_2×{}_{7}C_{1}}{{}_{10} C_3}=\frac{3}{120}=\frac{1}{40}$
このように、$\frac{1}{40}$という事が分かりました。
超幾何分布の分期待値と分散
超幾何分布の期待値と分散は以下の式で求める事ができます。
- 期待値:$E(X)=n×\frac{k}{N}=np$
- 分散:$n×\frac{k(N-k)}{N^2}×\frac{N-n}{N-1}=np(1-p)×\frac{N-n}{N-1}$
練習問題
①
答え:0.148
問題文を整理すると、
- $p=\frac{1}{3}$
- $k=3$
となります。これを↓の公式に当てはめて考えます。
$P(X=k)=p(1-p)^{k-1}$
$=\frac{1}{3}×(\frac{2}{3})^2$
$=\frac{1}{3}×\frac{4}{9}=\frac{4}{27}$
$=0.148….$
②
答え:0.435
問題分を整理すると↓になります。
- $N=13$
- $k=8$
- $N-k=5$
- $n=5$
- $x=3$
これを↓の式に当てはめます。
$P(x)=\frac{{}_k C_x×{}_{N-k}C_{n-x}}{{}_NC_n}$
$=\frac{{}_8 C_3×{}_{5}C_{2}}{{}_{13} C_5}=\frac{56×10}{1287}$
$=\frac{560}{1287}=0.435….$