母平均の検定とは
平均 ,分散 をもつ母集団 から,互いに独立な標本 を取り出し,その平均として標本平均 ,不偏分散 を次のように求めます:
このとき,次のように構成した確率変数 は,自由度 の 分布に従います:
標本平均,不偏分散の実現値(観測値)を ,検証したい帰無仮説 とすると,確率変数 の実現値 は,
となります.この と適当な有意水準のもとでの のパーセント点とを比較することで母平均 についての帰無仮説 を検定することができます.
母集団分布の仮定が 分布に従うのは,母集団分布が正規分布であるときのみです.もし母集団分布が正規分布でない場合には,中心極限定理から が十分大きい について成り立つことを利用します.ここで は母分散ですが,標本の不偏分散 は の一致推定量であるので,代用することもできます.
Rによる母平均の検定
例題
次の表は,あるクラスの生徒5人の試験の得点です.
生徒 | A | B | C | D | E |
---|---|---|---|---|---|
得点 | 72 | 64 | 68 | 80 | 72 |
この試験のクラスでの得点平均は74点であったとするとき,この5人の特定平均はクラスの平均と異なるかどうかを検定します.
統計量の用意
mean
関数で標本平均,sd
関数で不偏分散の平方根(サンプルの標準偏差)を計算できます.RStudioのコンソールに値を登録していきます。
Rの分散関数Rの
sd
関数で返却されるのは標本分散の偏差:
ではなく、不偏分散の偏差:
であることに注意が必要です。
標本サイズは length
関数で取得します.
> samples <- c(72, 64, 68, 80, 72)
> xbar <- mean(samples)
> std <- sd(samples)
> mu <- 74
> size <- length(samples)
> xbar
# [1] 71.2
> std
# [1] 5.932959
> size
# [1] 5
t値を計算
値を構成します.平方根は sqrt
関数で出します.
> t <- ( xbar - mu ) / ( std / sqrt(size) )
> t
# [1] -1.05529
検定を行う
今回は有意水準 で検定することにします.帰無仮説と対立仮説はそれぞれ,
ですから,両側検定となります.したがって,自由度 の分布の上側 2.5% 点を求めることになります.
> -qt(0.025, df=4)
# [1] 2.776445
分布は左右対称ですから,
より,有意水準 5% で帰無仮説 を棄却しません.よって,結論は「5人のスコアの平均はクラス平均と異なるとは言えない」となります.