この講座の対象者は以下の方を想定しています。
- 数学は中学レベルしか分からないけど統計検定2級に合格したい
- どの参考書を見ても数式だらけで理解できない
- 確率変数って何?
- 期待値ってどうやって求めるの?
この講座では特に、0の状態から統計検定2級に合格したいって方のために、分かりやすさをモットーに解説していきます。
今回は、統計学において重要な概念である確率変数について解説します。
是非最後までご覧ください。
確率変数とは?

確率変数とは、統計学において、起こりうる出来事に対して値を割り当てられた変数です。
確率変数は、離散型確率変数と連続型確率変数に分類されます。(今後の講座で詳しく解説します)
確率変数の例
簡単な例としては以下の物があります。
- サイコロを振ったときに出る目の数
- コインを投げたときに表が出るか裏が出るか
- 宝くじ
サイコロを例に考えると、出る目としては1~6まであります。
出る確率はそれぞれの目が$\frac{1}{6}$というのは皆さんご存知ですよね?
ここで大事になってくるのが確率変数です。
サイコロを振って出る目を$X$で表すと、1~6のどれかが出るので↓の式で表せます。
$P(X)=\frac{1}{6} (X = 1, 2, 3, 4, ,5 ,6)$
$(X = 1, 2, 3, 4, 5, 6)$は$X$が取りうる値を示しており、$P(X)$は確率を表しています。
例えば、サイコロの1の目が出る事象の確率が$\frac{1}{6}$である事は、$X$に3を代入して↓の様に書きます。
$P(3) = \frac{1}{6}$
確率分布とは?
$X$の値と、確率$P$は、↓のような表にまとめる事ができます。
この表のことを確率分布と言います。
$X$ | 1 | 2 | 3 | 4 | 5 | 6 | 計 |
$P$ | $\frac{1}{6}$ | $\frac{1}{6}$ | $\frac{1}{6}$ | $\frac{1}{6}$ | $\frac{1}{6}$ | $\frac{1}{6}$ | 1 |
まさに、確率が分布している様を表現していますね!
前にも話しましたが、確率($P$)の値を全て合計すると1になります。
確率変数の期待値
確率変数の期待値とは、確率変数が取る値の平均値です。
例えば宝くじの場合、
$\frac{賞金の総額}{全てのくじの販売数}=くじ1本あたりの賞金の平均$
これで、くじ1本あたりの賞金平均が分かりますね。
例えば賞金総額が1000円で、くじが10本売れた場合の賞金の平均額は100円です。
この平均値の事を期待値というのです。
確率分布から期待値を求める
上記の例は簡単でしたのですぐに計算する事ができましたが、実際はもっと複雑です。
そんな時は確率分布を使う事で整理できます。
例題をもとに見ていきましょう。
くじが100本ある。1等は賞金1000円で5本、2等は賞金500で10本、3等は賞金300円で20本、はずれは65本である場合、このくじの期待値を求めよ。
まずは、確率分布を作成します。
1等があたる確率は100本中5本だけですので、$\frac{5}{100}=\frac{1}{20}$ですね。はずれは$\frac{65}{100}=\frac{13}{20}$このようにして作ります。
$X$ | 1000円 | 500円 | 300円 | 0円(はずれ) |
$P$ | $\frac{1}{20}$ | $\frac{1}{10}$ | $\frac{1}{5}$ | $\frac{13}{20}$ |
次に、それぞれの$X$×$P$を行い、足し合わせることで、期待値を求める事ができます。
$1000×\frac{1}{20}+500×\frac{1}{10}+300×\frac{1}{5}+0×\frac{13}{20}$
$=50+50+60+0=160$
結果、1枚当たりの期待値は160円だという事が分かりました。
ちなみに確率変数の期待値には$E(X)$を使い、
$E(X)=160$
と書くことができます。
確率変数の分散の求め方
平均が分かったら次は分散を求めたくなるのが統計学ですねw
先ほどの確率分布をもとに、分散を求めて見ましょう。
確率変数の分散の公式
$V(X)=(x_1-μ)^2×p_1+(x_2-μ)^2×p_2$
$+…+(x_n-μ)^2×p_n$
これが確率変数の分散の公式です。
各記号の意味は↓です。
- $V(X)$:分散
- $μ$:期待値である$E(X)$の事です
- $X$:確率変数
- $p$:それぞれの確率変数の確率
- $(x_n-μ)^2$:偏差の2乗
このように、確率変数の分散は「偏差の2乗×確率」を足し合わせる事で求める事ができます。
先ほどのくじを例に分散を求めてみましょう。
$X$ | 1000円 | 500円 | 300円 | 0円(はずれ) |
$P$ | $\frac{1}{20}$ | $\frac{1}{10}$ | $\frac{1}{5}$ | $\frac{13}{20}$ |
まず、$μ$である期待を求める必要がありますが、先ほど160とすでに求めてあるのでこの数字を使い、公式に当てはめます。
$(1000-160)^2×\frac{1}{20}+(500-160)^2×\frac{1}{10}+(300-160)^2×\frac{1}{5}+(0-160)^2×\frac{13}{20}$
$=35280+11560+3920+16640=67400$
分散は67400という事が分かりました。
確率変数の分散は「偏差の2乗×確率」の総和
確率変数の期待値と分散の公式
確率変数の期待値と分散には様々な公式があります。
それを覚える事で、計算時間の短縮につながったり、統計検定ではそもそも公式を覚えていないと解けない様な問題も出てくるのでしっかりと覚えましょう。
前に確率の場合は独立であるかが重要といった話しをしました。
これから出てくる公式も独立であるかどうかによって成り立つか、成り立たないかが決まるものもありますので、この点意識しましょう。
良く出る期待値と分散の公式
以前コチラでも、データを加工すると平均や分散がどのように変化するか解説しました。
その時と記号などもちょっと変わっているため注意してください。
まずは前にもやった以下の2つの場合です。
- 各データに$a$を加えると、平均は$a$増加し、分散は変化しない
- 各データに$k$を掛けると、平均は$k$倍になり、分散は$k^2$倍になる
これらは確率変数の期待値と分散にも言えるのです。
$E(X)$を期待値で$V(X)$を分散とすると、↓の式になります。
各データ$(X)$に$a$を加えると
- $E(X+a)=E(X)+a$…平均が$a$増える
- $V(X+a)=V(X)$…分散は変化せず
各データ$(X)$に$k$を掛けると
- $E(kX)=kE(X)$…平均は$k$倍
- $V(kX)=k^2V(X)$…分散は$k^2$倍
このような公式が成り立ちます。
では続いて、各データ$(X)$に$k$を掛けてから$a$を足すと↓になります。
- $E(kX+a)=kE(X)+a$…平均は$k$倍かつa増える
- $V(kX+a)=a^2V(X)$…分散は$k^2$倍
また、分散では次の式も成り立ちます。
- $V(X)=E(X^2)- \lbrace E(X)\rbrace^2$
これが何を表しているのかというと、$E(X^2)$は確率変数$X^2$の期待値を表しています。
また$\lbrace E(X)\rbrace^2$は確率変数$X^2$の期待値の2乗です。
つまり、確率変数$X^2$の期待値から確率変数$X^2$の期待値の2乗を引くと分散になるのです。
和の期待値は期待値の和である
いままでは確率変数が1つの場合を見てきましたが、複数の場合を考えてみましょう。
$X$と$Y$の2つの確率変数があるとき、その2つの和の期待値は以下の公式から求められます。
- $E(X+Y)=E(X)+E(Y)$
そのまんまですね。
和の期待値は期待値の和です。
例題
ここでひとつ、簡単な問題をやってみましょう。
サイコロを2つ投げた場合の出る目の期待値を求めなさい。
まず大事なのが、「サイコロを2つ」とあるので、確率変数が2つあります。
そして、その2つの期待値の和を求められているので$E(X+Y)=E(X)+E(Y)$を使えば良さそうです。
- $E(X)$:一個目のサイコロの期待値
- $E(Y)$:二個目のサイコロの期待値
このように考えると簡単ですね。
また、確率分布は下のようになっています。
$X$ | 1 | 2 | 3 | 4 | 5 | 6 |
$P$ | $\frac{1}{6}$ | $\frac{1}{6}$ | $\frac{1}{6}$ | $\frac{1}{6}$ | $\frac{1}{6}$ | $\frac{1}{6}$ |
ここからまずは$E(X)$を求めましょう。
$E(X)=1×\frac{1}{6}+2×\frac{1}{6}+3×\frac{1}{6}+4×\frac{1}{6}+5×\frac{1}{6}+6×\frac{1}{6}$
$=\frac{21}{6}=\frac{7}{2}=3.5$
$E(X)$サイコロ1個の期待値が3.5だという事が分かりましたね。
$E(Y)$もサイコロですので、期待値は同じ3.5ですね!
これを↓の公式にあてはめます。
$E(X+Y)=E(X)+E(Y)$
$3.5+.3.5=7$
このようにして、サイコロ2つ投げた場合の期待は7だという事が分かりました。
独立な場合の確率変数の公式
確率変数$X$と$Y$が互いに独立している場合にのみ成り立つ公式もあります。
独立とはどんな意味だったか覚えていますか?
結果が互いに影響を及ぼさない場合を独立と言うんでした。
例えば、サイコロを2回投げる場合、1回目の出た目がなんであれ2回目の出る目の確率は変化しませんよね?全て$\frac{1}{6}$のままです。
これが独立です。
しかし、くじ等の場合は1回くじを引くとその分枚数が減るので次に引く場合、確率が変化します。
これは独立ではありません。
では独立している場合、↓の2つの公式が成り立ちます。
- $E(XY)=E(X)E(Y)$
- $V(X+Y)=V(X)+V(Y)$
$E(XY)=E(X)E(Y)$は、確率変数$X$と$Y$の積の期待値は、$X$と$Y$の期待値の積です。
またサイコロを例に見てみましょう。
サイコロを2回投げて、出た目を掛けた場合の数の平均を求めてみます。
先ほどの例題からサイコロの期待値は3.5という事が分かっているので、
$E(XY)=3.5×3.5=12.25$
このように、$12.25$という事が分かりました!
何度も言いますがが、これは独立だから成り立っています。
分散を公式から導きだす
$V(X+Y)=V(X)+V(Y)$
2つ目のこの公式は、$X$と$Y$の和の分散は、$X$と$Y$の分散の和です。
これもサイコロを例に求めてみましょう。
まず、サイコロ1個の分散はまだ求めていなかったので求めましょう!
↓の公式を使えば計算できるのでした。
$V(X)=E(X^2)- \lbrace E(X)\rbrace^2$
$\lbrace E(X)\rbrace^2$は上で$E(X)=3.5$と分かっているのでそれを2乗して、$12.25$という事が分かります。
あとは$E(X^2)$を求めます。
これは$X$を2乗したものの平均ですので、下の式で求められます。
$(1^2+2^2+3^2+4^2+5^2+6^2)÷6=15.16666…$
ですので、15.16667だとわかります。これで公式の計算ができますね!
$V(X)=E(X^2)- \lbrace E(X)\rbrace^2=15.16667-12.25$
$V(X)=2.91667$
これで確率変数$X$の分散は2.91667だという事が分かりました。
ちなみに確率変数$Y$の分散も同じサイコロなので2.91667ですね。
と言う事で、$V(X)$と$V(Y)$の値が分かったので、公式に当てはめて$V(X+Y)$を求めましょう。
$V(X+Y)=V(X)+V(Y)$
$V(X+Y)=2.91667+2.91667=5.83334$…答え
このようにして求める事ができました。
確率変数の公式まとめ
今回の内容はかなりボリューミーだったと思います。
特に統計検定2級では確率変数の公式は覚えておかないと解けないような問題が多いです。
そこで、今回習った公式をまとめましたので、復習する際に活用してください。
期待値の公式
- $E(kX)=kE(X)$
- $E(X+a)=E(X)+a$
- $E(kX+a)=kE(X)+a$
- $E(X+Y)=E(X)+E(Y)$
独立の場合に成り立つ公式
- $E(XY)=E(X)E(Y)$
分散の公式
- $V(kX)=k^2V(X)$
- $V(X+a)=V(X)$
- $V(kX+a)=k^2V(X)$
- $V(X)=E(X^2)- \lbrace E(X)\rbrace^2$
独立の場合に成り立つ公式
- $V(X+Y)=V(X)+V(Y)$
練習問題
①
答え: 期待値:75 分散:3125
一回目のじゃんけんを$X$とし、二回目を$Y$とします。
1回目に貰える金額は0円か50円で、勝つ確率は$\frac{1}{2}$です。
これを基に$E(X)$と$V(X)$を求めます。
$E(X)=0×\frac{1}{2}+50×\frac{1}{2}=25$
$V(X)=(0-25)^2×\frac{1}{2}+(50-25)^2×\frac{1}{2}=625$
続いて2回目のじゃんけんの$E(X)$と$V(X)$を求めます。
$E(X)=0×\frac{1}{2}+100×\frac{1}{2}=50$
$V(X)=(0-50)^2×\frac{1}{2}+(100-50)^2×\frac{1}{2}=2500$
$X$と$Y$は互いに独立であるため、以下の公式を使い答えを求められます。
- $E(X+Y)=E(X)+E(Y)=25+50=75$
- $V(X+Y)=V(X)+V(Y)=625+2500=3125$
②
答え:21
$E(Y)=E(5X-4)=5E(X)-4$
$=5×5-4=21$
Work illustrations by Storyset