統計検定をとることがキャリア的に少し意味が出てきそうになってきたので、また重要事項の整理を始めたいと思います。
統計検定1級の過去問で仮説検定の問題を解いていたのですが、標準正規分布とχ二乗分布、t分布、F分布という地盤がぐらぐらだ、、ということに気づいたのでまとめなおしていきます。
今回は標準正規分布とχ2乗分布の関連について証明を入れて考えていきます。
標準正規分布とカイ2乗分布の関連
定理
確率変数 \( Z \) が標準正規分布に従うとすると、その2乗は自由度1のカイ2乗分布に従う。
\( Z^2 \sim \chi_1^2 \)
さらに、それぞれ独立な確率変数 \( Z_1, Z_2, …, Z_n \) があるとすると、その和は自由度 \( n \) のカイ2乗分布に従います。
\( Z_1^2 + Z_2^2 + … + Z_n^2 \sim \chi_n^2 \)
標準正規分布の2乗がカイ2乗分布になるというのは重要で、仮説検定でもよくつかわれます。これを証明していきます。
証明①
まずは一つの確率変数 \( Z \) の場合です。標準正規分布の確率密度関数は
\( f(z) = \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{z^2}{2}\right) \)
となります。
ここで平方変換を行います。 \( z^2 = y \) としてみます。
ちなみに平方変換は
\( f(y) = \frac{d}{dy} \int_{-\sqrt{y}}^{\sqrt{y}} f(z) dz \)
標準正規分布は原点を軸に左右対称となるため
\( \{ f(\sqrt{y}) + f(-\sqrt{y}) \} \frac{1}{2\sqrt{y}} = f(y) \cdot \frac{1}{\sqrt{y}} \)
となります。
これを最初の式に当てはめると
\( \Gamma\left(\frac{1}{2}\right) = \sqrt{\pi} \) なので
\( f(y) = \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{y}{2}\right) \cdot \frac{1}{\sqrt{y}} \)
と変形できます。
一般に自由度 \( n \) のカイ二乗分布は \( Ga(\frac{n}{2},2) \) であり、自由度1のカイ2乗分布は \( Ga(\frac{1}{2},2) \) となるので、上記の式と一致します。
証明②
続いて \( Z_1^2 + Z_2^2 + … + Z_n^2 \sim \chi_n^2 \) を証明します。
これは要するにカイ2乗分布の和の再生性、つまり
\( \chi_m^2 + \chi_n^2 = \chi_{m+n}^2 \)
が証明できればよいです。
さらにこれは上記のようにカイ2乗分布はガンマ分布の特殊形であるため、ガンマ分布の和の再生性が証明できれば良いと言えます。
確率密度関数の和については主に畳み込み法とモーメント母関数を用いた方法がありますが、モーメント母関数のほうが簡単なのでそちらを使ってみます。
簡単のため、互いに独立なガンマ分布 \( Ga(\alpha,1) \) と \( Ga(\beta,1) \) の和を考えてみます。この和が \( Ga(\alpha+\beta,1) \) になればよいと言えます。
まず、\( Ga(\alpha,1) \) のモーメント母関数を導出します。やり方としてはガンマ関数をうまいこと作り出して変形していきます。
\[ E[e^{tX}] = \int_{0}^{\infty} \frac{1}{\Gamma(\alpha)} x^{\alpha-1} \exp(-x+tx) dx \] \[ = \frac{1}{\Gamma(\alpha)} \int_{0}^{\infty} x^{\alpha-1} \exp{-(1-t)x} dx \] \]
ここで \( (1-t)x=y \) と変換すると \( dx=1/(1-t) dy \) となるので
\[ \frac{1}{\Gamma(\alpha)}\int_{0}^{\infty}x^{\alpha-1} \exp{-(1-t)x}dx \] \[ = \frac{1}{(1-t)^\alpha} \frac{1}{\Gamma(\alpha)}\int_{0}^{\infty} y^{\alpha-1} \exp(-y) dy \] \[ = \frac{1}{(1-t)^\alpha} \frac{1}{\Gamma(\alpha)} \Gamma(\alpha) \] \[ = \frac{1}{(1-t)^\alpha} \] \]
となります。
全く同様にして \( Ga(\beta,1) \) についても
\[ \frac{1}{(1-t)^\beta} \]
となることが分かります。
すると二つの和のモーメント母関数は
\[ E[e^{tX+tY}] = E[e^{tX}]E[e^{tY}] \] \[ = \frac{1}{(1-t)^\alpha} \frac{1}{(1-t)^\beta} \] \[ = \frac{1}{(1-t)^{\alpha+\beta}} \] \]
となり、最後の式は \( Ga(\alpha+\beta,1) \) のガンマ分布に他ならないため、ガンマ分布の和の再生性が証明できました。
以上から
「ガンマ分布の和の再生性がある → カイ2乗分布の和の再生性がある」となり、証明①で示したように、「自由度1のカイ2乗分布 = 標準正規分布の2乗」となることを踏まえると「標準正規分布の2乗の和は自由度nのカイ2乗分布に従う」と言えます。
モーメント母関数や変数変換の良い練習になりますね。
参考文献:
コメントを残す