※ブログ記事の商品・サービスリンクにはアフィリエイトリンクが含まれます。

一様最強力検定とネイマン-ピアソンの補題【統計検定1級対策】

以前の記事で有意水準と検出力、それらをもとにした一様最強力検定については書きました。

第1種過誤・第2種過誤・検出力の関係をグラフで見る【統計検定1級対策】

今回は一様最強力検定を求める一つの方法であるネイマンピアソンの補題について書きます。

ネイマンピアソンの補題の成立条件

条件として単純仮説であることが前提です。単純仮説・複合仮説が分からない方はこちらをご参考ください。

単純仮説/複合仮説の場合における有意水準αの仮説検定(例題付き)【統計検定1級対策】

まず、この補題で求められる一様最強力検定とはどのようなものなのかを示します。

ある確率密度関数 \( f(x, \theta) \)(\( \theta \) はパラメータです)において

帰無仮説 \( H_0: \theta = \theta_0 \)

対立仮説 \( H_1: \theta = \theta_1 \)

としたとき、\( H_0 \) の棄却域が

\[ \frac{f(x, \theta_0)}{f(x, \theta_1)} < C \]

を満たせば、一様最強力検定となります。

(ただし \( C > 0 \) です)

これはつまり尤度比検定で得られる式と同じです。尤度比検定については下記を参照してください。

尤度比検定、ワルド検定、スコア検定をできるだけ分かりやすくまとめる【統計検定1級対策】

では、なぜこうなるのか。

ネイマン-ピアソンの補題の証明

検定関数

示し方は色々あるのですが、根本的な部分はどの本でも同じです。今回は分かりやすかった証明方法を紹介します。

まず「棄却域を満たす」という条件を場合分けしたりして示すのは、結構めんどくさくなるので、検定関数 \( \phi(x) \) というものを便宜上導入します。

検定関数とは棄却域に入ると1、入っていなければ0となる定義関数です。

式で表すと棄却域を \( R \) としたときに

\[ \phi(x) = \begin{cases} 1, & x \in R \\ 0, & x \notin R \end{cases} \]

となります。

証明

まず、一様最強力検定の条件を確認し直してみましょう。

① 有意水準(もしくはサイズ)\( \alpha \) の検定でなければいけない=帰無仮説の条件下で棄却域に入る確率が \( \alpha \) 以下

② サイズ \( \alpha \) の検定の中で検出力が最大でなければいけない=対立仮説の条件下で棄却域に入る確率が最大

③ ①,②の条件を満たす検定を求める

となります。

これを数式に翻訳すると

① \[ \int \phi(x) f(x, \theta_0)dx \leq \alpha \]

② \[ \int \phi(x) f(x, \theta_1)dx \] を最大にする

③ ①,②を満たす \( \phi(x) \) の条件を求める

ということになります。つまり、①の条件を使って②が最大となるような検定関数を見つけ出せば良いわけです。

任意の定数 \( c \)(\( c > 0 \))を用いて②の式をみていくと

\[ \int \phi(x) f(x, \theta_1) dx = \int \phi(x) f(x, \theta_1) dx – c\alpha + c\alpha \] \[ \leq \int \phi(x) f(x, \theta_1) dx – c\int \phi(x) f(x, \theta_0) dx + c\alpha \] \[ = \int \phi(x) \{ f(x, \theta_1) – c f(x, \theta_0) \} dx + c\alpha \]

となります。

この式が最大となるためには \( c\alpha \) は定数であるため

\[ \int \phi(x) \{ f(x, \theta_1) – c f(x, \theta_0) \} dx \]

が最大となればよいことが分かります。

積分の式なので、これを最大にするような検定関数 \( \phi(x) \) は

\( f(x, \theta_1) – c f(x, \theta_0) \) が正のときに \( \phi(x) = 1 \)

逆に負のとき \( \phi(x) = 0 \) となれば良いと言えます。

数式にすると

\[ \begin{cases} f(x, \theta_1) – c f(x, \theta_0) > 0 のとき & \phi(x) = 1 \\ f(x, \theta_1) – c f(x, \theta_0) < 0 のとき & \phi(x) = 0 \end{cases} \]

つまり、棄却域が

\[ f(x, \theta_1) – c f(x, \theta_0) > 0 \]

となり、\( \frac{1}{c} = C \) とすれば、最初の式が示されたことになります。

 参考文献:

数理統計学―データ解析の方法

 

数理統計学―データ解析の方法

  • 作者: 竹内 啓
  • 発売日: 2017/11/03
  • メディア: Kindle版
 

ちょっと古い本なので読みにくいところもありますが、数式は丁寧に示していただいているほうではあり、『現代数理統計学の基礎』の次くらいにお勧めです。 

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)