統計学 PR

母分散が分からない場合の母平均の差の検定【0から始める統計検定2級講座㉝】

記事内に商品プロモーションを含む場合があります

この講座の対象者は以下の方を想定しています。

  • 数学は中学レベルしか分からないけど統計検定2級に合格したい
  • どの参考書を見ても数式だらけで理解できない
  • 母平均の差の検定はどうやるの?
  • 母分散が分からなくても母平均の差の検定はできる?

この講座では特に、0の状態から統計検定2級に合格したいって方のために、分かりやすさをモットーに解説していきます。

今回は、母分散が分からない場合の母平均の差の検定を行います。
前に母分散が分かっている場合の求め方はやりましたが、それの母分散が分からない版です。

 

母分散が等しいとみなせるか?

母分散が分からない場合に、2つの母平均の差の検定を行いますが、まず以下の2つのケースがあります。

  • 母分散の値は分からないが、等しいとみなせる
  • 母分散の値は分からず、等しいとも限らない

このように、2つのケースで母平均の検定方法が変わります。

 

まずは等分散の検定

ですので前講座でやった等分散の検定を行い、母分散が等しいとみせなるのか?検証を行います。
これがスタートになります。

等分散の検定が分からない方は下記の講座を復習しましょう。

F分布で等分散の検定!【0から始める統計検定2級講座㉜】この講座の対象者は以下の方を想定しています。 数学は中学レベルしか分からないけど統計検定2級に合格したい どの参考書...

例題

ではさっそく、例題をもとに解き方を見ていきましょう。

A店では、2つのパン工場からメロンパンを仕入れている。
$X$工場のメロンパンを無作為に8個取り出し重量を測ったところ、標本平均$\bar{X}$は120gで不偏分散$U_X^2$は25であった。
続いて、$Y$工場のメロンパンを無作為に9個取り出したところ、標本平均$\bar{X}$は123gで不偏分散$U_X^2$は16であった。
この結果から、2つの工場によって、製品の重さに差があると言えるか?
有意水準5%で検定せよ。

まずは等分散の検定を行いましょう!

 

①帰無仮説と対立仮説

いつも通り帰無仮説と対立仮説をたてます。

  • 帰無仮説$\sigma_X^2=\sigma_Y^2$
  • 対立仮説$\sigma_X^2 \neq \sigma_Y^2$

 

②検定統計量を求める

不偏分散を使って、検定統計量$F$を求めます。

$F=\frac{U_X^2}{U_Y^2}=\frac{25}{16}=1.5625$

 

③棄却域の設定

今回$m=8$、$n=9$ですので、自由度は各$-1$するために以下のようになります。

  • 自由度$(7, 8)$

また、今回は両側検定ですので、F分布の左右2.5%ずつが棄却域となります。
F分布表から対応する値を探すと、

1 2 3 4 5 6 7 8 9 10
7 8.073 6.542 5.890 5.523 5.285 5.119 4.995 4.899 4.823 4.761
8 7.571 6.059 5.416 5.053 4.817 4.652 4.529 4.433 4.357 4.295

上側2.5%点は$4.529$です。

また下側2.5%点は、自由度$(8, 7)$の2.5%点の逆数ですので、

$\frac{1}{4.899}=0.204$

となります。

 

④帰無仮説が正しいかどうか検証

結果をまとめると、検定統計量$F=1.5625$は、$4.529$以上でも$0.204$以下でもないために、棄却域に入らない事が分かりました。

帰無仮説は棄却されず、2つの母分散は等しくないとは言えないことが分かりました。

 

このように、母平均の差の検定を行う前に等分散の検定を行います。
上記の結果から、$\sigma_X^2 = \sigma_Y^2$と仮定して、母平均の差の検定を行います。

 

 

母分散が等しいとみなせる場合の母平均の差の検定

ここからが本題ですね!
等分散の検定を行い、母分散が等しいとみなせる事が分かったら、母平均の差の検定に入ります。

流れとしてはいつもと同じ以下の順で行います。

  1. 帰無仮説と対立仮説をたてる
  2. 検定統計量を求める
  3. 棄却域の設定
  4. 帰無仮説が正しいか検証

それではやっていきましょう。

 

①帰無仮説と対立仮説を立てる

まずは、$X$工場と$Y$工場のメロンパンの母平均が等しいと仮定します。
そうすると、帰無仮説と対立仮説は以下のようになります。

  • 帰無仮説:$μ_X=μ_Y$
  • 対立仮説:$μ_X \neq μ_Y$

 

 

②検定統計量を求める

検定統計量$T$を求めるには以下の式から求める事ができます。

$T=\frac{\bar{X}-\bar{Y}-(μ_X-μ_Y)}{\sqrt{(\frac{1}{m}+\frac{1}{n})U_{XY}}}$

大分複雑になってきましたね。
まず、初めて出てくるものとして$U_{XY}$があります。
これは、合併した分散であり、不偏分散の$U_X^2$と$U_Y^2$の、それぞれの自由度を重みとした加重平均です。

まず、この$U_{XY}$を求める事が必要なのですが、これは以下の式から求められます。

$\frac{(m-1)U_X^2+(n-1)U_Y^2}{m+n-2}$

えいせい
えいせい
今回の講座は覚える事が多いですが、この2つの公式は必須ですので必ず覚えておきましょう!

 

では実際に$U_{XY}$を求めていきましょう。

$U_{XY} = \frac{(8-1)×25+(9-1)×16}{8+9-2}=20.2$

$U_{XY}$が$20.2$という事がわかりました。
これを使って、↑の式から検定統計量を求めていきます。
ちなみに、$(μ_X-μ_Y)$は等しいと仮定しているので$0$になることは前にやりました。

 

$T=\frac{120-123-0}{\sqrt{(\frac{1}{8}+\frac{1}{9})×20.2}}=\frac{-3}{\sqrt{(0.125+0.111)×20.2}}=-1.374$

検定統計量$T$は$-1.374$という事が分かりました。

 

③棄却域を設定

この検定統計量$T$は、自由度$m+n-2$のt分布に従います。
ですので今回は自由度$15$で、両側検定のため、左右2.5%が棄却域になります。

 

F分布表(自由度11~20)

$n$ $0.005$ $0.01$ $0.025$ $0.05$
$11$ 3.106 2.718 2.201 1.796
$12$ 3.055 2.681 2.179 1.782
$13$ 3.012 2.650 2.160 1.771
$14$ 2.977 2.624 2.145 1.761
$15$ 2.947 2.602 2.131 1.753
$16$ 2.921 2.583 2.120 1.746
$17$ 2.898 2.567 2.110 1.740
$18$ 2.878 2.552 2.101 1.734
$19$ 2.861 2.539 2.093 1.729
$20$ 2.845 2.528 2.086 1.725

F分布表から自由度$15$で0.025に対応する値は$2.131$という事がわかりました。
これは、上側%点ですが、t分布は左右対称の分布のため、下側%点は$-2.131$です。

 

④帰無仮説が正しいか検証

上記の結果をまとめると、

  • 検定統計量$T=-1.374$
  • 上側%点:$2.131$
  • 下側%点:$-2.131$

このような結果になりました。
検定統計量は棄却域に含まれませんでしたので、帰無仮説は棄却されません。

「$X$工場と$Y$工場のメロンパンの重量の平均は等しくないとはいえない」という結論になりました。

 

 

母分散が等しいとも限らない場合の母平均の差の検定

では続いて、母分散が等しいとも限らない場合のパターンを見ていきましょう。

このパターンの検定方法としては、ウェルチのt検定が使われます。

 

ウェルチのt検定とは

ウェルチのt検定は、イギリスの統計学者のバーナード・L・ウェルチが考案した方法です。
詳細は割愛しますが、ウェルチのt検定では、下記の式をつかい統計量を求めます。

$T=\frac{\bar{X}-\bar{Y}-(μ_X-μ_Y)}{\sqrt{\frac{U_X^2}{m}+\frac{U_Y^2}{n}}}$

この式で統計量を求めるのがウェルチのt検定です。
その他の部分は一緒ですので、理解しやすいと思います。

 

例題

では実際に、ウェルチのt検定を使い、母分散が等しいとも限らない場合の母平均の差の検定方法を見ていきましょう。

ある八百屋さんでは、スイカを2つの農家から仕入れていた。
$X$農家から仕入れたスイカのうち6個の直径を測ったところ、標本平均$\bar{X}$は32cmで不偏分散$U_X^2$は9であった。
$Y$農家から仕入れたスイカのうち8個の直径を測ったところ、標本平均$\bar{Y}$は30cmで、不偏分散$U_Y^2$は25であった。
2つの農家のスイカの直径は差があると言えるか?有意水準5%で検定せよ。

今回は、2つの母分散の値が分からず、かつ等しいとも限りません。
ですので、等分散の検定はおこないません。

 

①帰無仮説と対立仮説を立てる

いつものように、帰無仮説と対立仮説をたてます。

  • 帰無仮説:$μ_X = μ_Y$
  • 対立仮説:$μ_X \neq μ_Y$

 

②検定統計量を求める

問題文の情報をまとめると、

  • $\bar{X}=32$
  • $\bar{Y}=30$
  • $U_X^2=9$
  • $U_Y^2=25$
  • $m=6$
  • $n=8$

となります。
以下の式に代入して、検定統計量$T$を求めます。

$T=\frac{\bar{X}-\bar{Y}-(μ_X-μ_Y)}{\sqrt{\frac{U_X^2}{m}+\frac{U_Y^2}{n}}}$

$T=\frac{32-30-0}{\sqrt{\frac{9}{6}+\frac{25}{8}}}=\frac{2}{\sqrt{4.625}}=0.93$

検定統計量$T$は$0.93$という事が分かりました。

 

③棄却域の設定

検定統計量$T$は、帰無仮説が正しいとすれば、自由度$ν$(ニュー)のt分布にしたがいます。
ではどうやって$ν$を求めるのか?ですが、以下の式から求める事ができます。

$ν=\frac{(\frac{U_X^2}{m}+\frac{U_Y^2}{n})^2}{\frac{(U_X^2/m)^2}{m-1}+\frac{(U_Y^2/n)^2}{n-1}}$

えいせい
えいせい
この式は特に覚えなくて大丈夫です。

 

ではさっそく自由度$ν$を求めていきましょう。

$ν=\frac{(\frac{9}{6}+\frac{25}{8})^2}{\frac{(9/6)^2}{5}+\frac{(25/8)^2}{7}}=11.59$→$12$

このようにして、自由度は$12$という事が分かりました。

t分布表から自由度$12$の上側2.5%点を見ると、$2.179$という事がわかります。
t分布は左右対象なので、下側は$-2.179$ですね。

 

④帰無仮説が正しいか検証

では今までの結果をまとめると、

  • 上側2.5%点:$2.179$
  • 下側2.5%点:$-2.179$
  • 検定統計量$T=0.93$

このような結果になります。
したがって帰無仮説は棄却されず、「$X$工場と$Y$工場のメロンパンの重量の平均は等しくないとはいえない」という結論になりました。

 

 

今回の講座は大分内容が詰まっていたと思います。
母平均の差の検定は色んなパターンによって求め方が変わるので、覚えるのが大変です。
しかし、やっている事自体はそこまで難しく無く、公式を覚えてしまえば解ける問題ですので、着実に覚えていきましょう!

 

 

Work illustrations by Storyset

あなたにおススメの記事