統計学 PR

標本分散と不偏分散【0から始める統計検定2級講座㉒】

記事内に商品プロモーションを含む場合があります

この講座の対象者は以下の方を想定しています。

  • 数学は中学レベルしか分からないけど統計検定2級に合格したい
  • どの参考書を見ても数式だらけで理解できない
  • 不偏分散ってなに?
  • 標本分散と不偏分散は一致するの?

この講座では特に、0の状態から統計検定2級に合格したいって方のために、分かりやすさをモットーに解説していきます。

今回は標本分散と不偏分散についてです。
母平均が分からない場合の推定で必須の内容です。

 

不偏性とは?

今後の講座では、ある学校の生徒30人(標本)の学力を測定し、その学校全体(母集団)の学力を測定したり、母分散を推定したりします。

いわゆる推測統計学を学んでいきます。

えいせい
えいせい
ビジネスでも使える知識ですので、統計学が楽しくなってくるはずですw

 

その母平均や母分散を推定するのに必要な統計量を推定量といいます。

その推定量が備えるべき性質として、不偏性一致性がありますので、その点を解説していきます。

 

不偏性の説明

不偏性とは、推定値の期待値が母集団のパラメータに等しいことを意味します。

前講座では、標本平均$\bar{X}$の平均は母平均$μ$に一致する事を学びましたね。
ようは、標本を何度も採取し標本平均を求める作業を何回も繰り返します。
その標本平均からさらに平均を求めると、それは母平均に一致するというものでした。

この性質の事を不偏性と言います。

 

分散には不偏性は無い

では標本分散にも不偏性があるのでしょうか?

結論から言うと、標本分散には不偏性がありません。

標本分散$S^2$の平均は、母分散$\sigma^2$に一致するといった事もありません。
標本平均には不偏性がありますが、標本分散には不偏性が無いという事をしっかりと覚えておきましょう。

 

 

不偏分散とは?

では、母集団の推定量として使える不偏分散はないのでしょうか?
もしなかったら母集団の分散の推定が出来なくなってしまいますね。

でも安心してください。ちゃんと不偏分散を求める方法があります。

まず↓の式を見てください。これは、標本分散$S^2$の平均を求める式です。
(標本を何度も採取し、その度に分散を求めたものの平均)

 

$E(S^2)= \frac{n-1}{\sigma^2}$

この式を見ても分かる通り、母分散$\sigma^2$に$\frac{n-1}{n}$を掛けているので、標本分散$S^2$の方がわずかに小さくなっています。

えいせい
えいせい
この式からも、標本分散には不偏性がない事が分かります。

 

不偏分散の求め方

では、実際に不偏分散の求め方を見ていきましょう。

大事なポイントは、不偏性は平均が母分散と等しくなることです。

つまり、上記の標本分散$S^2$の平均を求める式の両辺に$\frac{n}{n-1}$を掛ければ求める事ができます。

 

$\frac{n}{n-1}E(S^2)=\frac{n-1}{n}\sigma^2×\frac{n}{n-1}$

これをどう解くかというと、$E(aX)=aE(X)$より、

->$E(\frac{n}{n-1}S^2)=\sigma^2$

このようになります。
式が良く分からないという方は、そこまで理解する必要はありません。

標本分散$S^2$に$\frac{n}{n-1}$を掛ければ不偏分散になります。
また、不偏分散は$U^2$で表します。

 

もっと簡単に言うと、標本分散は$n$で割るところ、不偏分散は$n-1$で割るだけの違いです。

 

  • $S^2=\frac{(X_1-\bar{X})^2+(X_2-\bar{X})^2+…(X_n-\bar{X})^2}{n}$
  • $U^2=\frac{(X_1-\bar{X})^2+(X_2-\bar{X})^2+…(X_n-\bar{X})^2}{n-1}$

 

 

 

一致性とは?

不偏性と一緒に覚えておいて欲しい単語として一致性というものがあります。
これは下記の様なものです。

標本の大きさ$n$がじゅうぶんに大きいと、標本分散$S^2$と不偏分散$U^2$はどちらも母分散$\sigma^2$に一致する。

これは前回の講義に出てきた、大数の法則に関わります。

「標本の大きさ$n$がじゅうぶんに大きければ、標本平均$\bar{X}$は母平均$μ$に一致する。」という事を学んだと思いますが、このような性質を一致性といいます。

 

サイコロの例

サイコロの母平均$μ$と母分散$\sigma^2$は下記の値になる事は何度か見てきました。

  • $μ=3.5$
  • $\sigma=2.9$

母集団であるサイコロを何度か振って平均を求める作業を何度も繰り返し、その平均を取って標本平均を求めます。
その標本の大きさが少ないと、標本平均$\bar{X}$が$3.3$や$3.6$になったりと母平均と違う値になります。

しかし、標本の大きさがじゅうぶんに大きいと、標本平均$\bar{X}$は母平均$μ$に一致します。

それと同じで、標本の大きさがじゅうぶんに大きいと標本分散$S^2$と不偏分散$U^2$はどちらも$2.9$に一致します。

 

 

まとめ

ここまでで、何となく不偏性、一致性という物があるんだなぁ~っと言う事は分かったと思います。

この両者の違いとしては、

不偏性は、推定値の期待値が母集団のパラメータに等しいことを意味します。
一致性は、標本サイズを大きくしていくと、推定値が母集団のパラメータに近づいていくことを意味しています。

不偏性と一致性は、どちらも推定量の重要な性質ですが、異なる性質です。
不偏な推定量が必ずしも一致するとは限りません。

また、推定量がもつ不偏性と一致性の有無をまとめると下記になります。

不偏性 一致性
標本平均
標本分散
不偏分散

 

特に、標本分散には不偏性が無いので、$n-1$で割った不偏性のある不偏分散があるという事が重要で、今後も頻出してきますのでしっかり覚えておきましょう。

 

 

WorStorysetk illustrations by 

あなたにおススメの記事