仮説検定の内容をまたまとめてみます。
統計検定1級でも過去に出題されているネイマン-ピアソンの補題について書こうと思いましたが、その前段階として、第一種の過誤、第二種の過誤と検出力についてグラフにして確認してみます。
目次:
第1種過誤
第1種過誤とは帰無仮説が正しいのに誤って棄却してしまうことを指します。文章で覚えようとすると分からなくなりますが、要するにこれは単純にたまたま本来起きにくいはずの有意水準の確率のことが起きてしまう場合です。
例えば有意水準はよくα=0.05でとられます。普通5%の確率で起きることなんてまず起きないと思うのですが、運悪くそれが起きてしまった。これが第1種過誤です。
よって、第1種過誤が起こる確率というのはそのまま有意水準αとなります。
簡単な例として平均μの正規分布に従う確率変数Xについて、以下の仮説を検定する場合を考えてみます。
帰無仮説
対立仮説
横軸に検定統計量(今回の例の場合はと考えます)、縦軸にその確率密度関数をとって、グラフにしてみます。
棄却域をZαとすると、上記のグラフの面積αが第1種過誤の起きる確率です。式として表すとこうなります。
帰無仮説の条件下で、検定統計量がZαより右側にあるときの面積なので
\(P(検定統計量\gt Z_\alpha|H_0)=\alpha\)
第2種過誤と検出力
第2種過誤は逆に対立仮説が正しいのに、帰無仮説を棄却できない場合です。これも上と同様の例でグラフにしてみてみます。
今回は対立仮説が正しい、という前提なので対立仮説のグラフをオレンジにして並列して描いています。対立仮説が正しい時に帰無仮説が棄却できない(=検定統計量が棄却域に入らない=検定統計量がZαよりも小さい)ことが起きる確率は面積βで表されます。式で表すと以下になります。
対立仮説が正しいという条件下に、棄却域に入らない状態なので
\(P(検定統計量\lt Z_\alpha|H_1)=\beta\)
この第2種過誤が起きない確率はグラフ右の1-βで表されます。これを検出力と呼びます。
一様最強力検定
第1種過誤、第2種過誤は当然どちらも起きない方がよいことです。今までの話を踏まえると、つまり有意水準αは小さいほうがよいですし、βは小さいほうがよい(=検出力は大きいほうがよい)ということになります。
同じ有意水準αの検定の中で、検出力1-βが大きいものを一様最強力検定といいます。最初に挙げたネイマン-ピアソンの補題は、一様最強力検定を求めるための条件式です。また次回の記事で書こうと思います。
参考文献:
いつも愛用している本です。
Kindleがあって便利なので買いましたが、あんまり開いてません。少し古めの本ですが、上の本で分からなかったときにたまに補助的に見てます。ただ、ネイマンピアソンの補題についてはこっちの方が分かりやすかったです。
コメントを残す