統計検定1級で頻出なテーマである確率密度関数の変数変換、平方変換、確率積分変換についてまとめてみようと思います。
目次:
変数変換
まずは変数変換から。
確率密度関数 \( f_X(x) \) に従う確率変数 \( X \) に対して \( g(X) = Y \) としたときに、\( Y \) が従う確率密度関数 \( f_Y(y) \) を求める方法です。ここで、\( g(X) \) は単調増加関数とします。
いつも思い出す時に変換の式をちょくちょく混乱するのですが、分布関数の定義そのものから導き出すことを覚えておくと、自分で導出することで確認ができます。
\[
F_Y(y) = P(Y \leq y) = P(g(X) \leq y)
\]
ここがスタートですね。
次にこれを積分の式まで持ち込みます。
\[
P(g(X) \leq y) = P\{X \in (x | g(x) \leq y)\} \\
= P\{X \in (x | x \leq g^{-1}(y))\} \\
= \int_{-\infty}^{g^{-1}(y)} f_X(x) \, dx
\]
よって
\[
f_Y(y) = \frac{d}{dy} F_Y(y) \\
= \frac{d}{dy} \int_{-\infty}^{g^{-1}(y)} f_X(x)dx \\
= \frac{d}{dy} F_X(g^{-1}(y)) \\
= \frac{d}{dy} g^{-1}(y) f_X(g^{-1}(y)) \\
= \frac{1}{g'(g^{-1}(y))} f_X(g^{-1}(y))
\]
となります。
\( g(X) \) が単調減少関数の場合も同様になりますので、公式としてまとめる場合
\[
f_Y(y) = \frac{1}{|g'(g^{-1}(y))|} f_X(g^{-1}(y))
\]
と言えます。
平方変換
続いて平方変換です。
\[
Y = X^2
\]
のような変換をする場合になります。
変数変換と基本的には同様の形式をたどります。
\[
F_Y(y) = P(Y \leq y) \\
= P(X^2 \leq y) \\
= P(X \in x | x^2 \leq y) \\
= P(X \in x | -\sqrt{y} \leq x \leq \sqrt{y}) \\
= \int_{-\sqrt{y}}^{\sqrt{y}} f_X(x)dx
\]
よって、
\[
f_Y(y) = \frac{d}{dy} \int_{-\sqrt{y}}^{\sqrt{y}} f_X(x)dx \\
= \frac{1}{2\sqrt{y}} \{ f_X(-\sqrt{y}) + f_X(\sqrt{y}) \}
\]
となります。
確率積分変換
統計応用医薬生物学の2017年の問1でこれを使った問題が出題されています。
確率積分変換は変数変換の特殊な例に当てはまりますが、基本的にやることは一緒です。ある確率分布関数 \( F_X(x) = Y \) と置換した時、\( Y \) は区間 \([0,1]\) の一様分布に従うというものです。
確率分布関数は 0〜1 の範囲に当てはまり( \( 0 \leq y \leq 1 \) )、また単調増加関数です。
上述の変数変換の式に従えば
\[
f_Y(y) = \frac{1}{f_X(F^{-1}_X(y))} f_X(F^{-1}_X(y)) \\
= 1
\]
となります。
過去問にも出ていましたが乱数形成にも使われる方法です。
一様分布に従うYの値を生成して、分布関数の逆関数さえ分かれば
\[
F^{-1}_X(y) = X
\]
とすることで任意の確率分布に従う数を生成することができます。
参考文献:
『現代数理統計学の基礎』
コメントを残す