最近は専門医試験のレポート期限が迫ってきたことや日本語で書かないといけない論文もあって、ちょっと更新ペースが落ちますが、ぼちぼちやっていきます。
確率変数の和と比について変数変換するとどのようになるか、といった問題も時々出ています。比についてはあまりまとめられているのを見たことがなかったので、まとめてみました。
目次:
確率変数の和・畳み込みを使う
Z=X+Yという確率変数がある時に、どうやってZの確率密度関数を求めるかを考えます。( X、Yは互いに独立とします)
通常とられる方法として「畳み込み」という方法があります。
何をやるかと言えば
①ヤコビアンが1になるような2変数に変換する
②片方の変数を全範囲で積分して同時確率密度関数→目的の確率密度関数を出す
ということをやります。
まず①ですが、Z=X+Y, W=Yとすると
X=Z-W
Y=W
なので、ヤコビアンは1になります。
そうするとz,wの同時確率密度関数は
まず、\(Z=\frac{X}{|Y|}\)とすると
\(P(Z<z)=P\left(\frac{X}{|Y|}<z\right)\)
となります。ここでYの値が正か負かで場合分けをすると
\(X<zY(Y>0), X<-zY(Y<0)\)
よって、zの分布関数はX,Yの確率密度関数をそれぞれf(x), f(y)として
\(F_Z(z)=\int_{-\infty}^0 dy \int_{-\infty}^{-zy} dx f(x) f(y) + \int_0^\infty dy \int_{zy}^\infty dx f(x) f(y)\)
となります。
ここで、解答でも指摘されているように、正規分布の対称性からこの二つの項は実は等しいことがわかりますので(分からなくてもそのまま計算できますが)1つにまとめると楽です。
\(F_Z(z)=2\int_0^\infty dy \int_{zy}^\infty dx f(x) f(y)\)
となります。
あとはこれをzで微分して
\(f_Z(z)=-2\int_0^\infty y f(zy) f(y) dy\)
最後に実際の確率密度関数を代入して積分すれば良いので
\(2\int_0^\infty -y f(zy) f(y) dy = -2\int_0^\infty y \frac{1}{\sqrt{2\pi}} e^{-\frac{(z^2+1)y^2}{2}}\\= \left[\frac{-2e^{-\frac{(z^2+1)y^2}{2}}}{2\pi(1+z^2)}\right]_0^\infty\\= \frac{1}{\pi(1+z^2)}\)
となり、標準正規分布同士の比がコーシー分布に一致することがわかりました。
また\(\frac{X}{X+Y}=W\)についてはZの確率密度関数から変数すれば簡単にわかります。
\(z=\frac{w}{1-w}\)となるので、\(dz=\frac{1}{(1-w)^2}dw\)
よって
\(f_W(w)=\frac{1}{\pi}\frac{1}{1+\left(\frac{w}{1-w}\right)^2}\frac{1}{(1-w)^2}\\= \frac{1}{\pi}\frac{1}{(1-w)^2+w^2}\)
となります。
よって
\(f_{Z,W}(z,w)=f_X(z-w)f_Y(w)\)
となります。
よって
\(f_Z(z)=\int f_X(z-w)f_Y(w)dw\)
が目的の確率密度関数といえます。
話としてはわかりやすいのですが、最後の積分で計算式が煩雑となるのが問題点です。
確率変数の和・モーメント母関数を使う
もう一つの方法がモーメント母関数を使う方法です。これは求めたい確率密度関数やX、Yの確率密度関数のモーメント母関数がわかっているときに有効な方法です。
\(M_Z(t)=E[e^{tZ}]\\=E[e^{t(X+Y)}]\\=E[e^{tX}]E[e^{tY}]\)
として求めることができます。
例として標準正規分布に従うX,Yの和を考えてみましょう。
\(E[e^{tX}]=E[e^{tY}]=e^{\frac{t^2}{2}}\)
なので
\(M_Z(t)=E[e^{tX}]E[e^{tY}]\\=e^{t^2}\)
となります。
よって、\(Z\sim N(0,2)\)であることがわかります。
正規分布における和の再生性と呼ばれる特性ですね。
確率変数の比
続いて、比について考えてみます。
\(Z=\frac{X}{Y}\)とした場合、Zの確率密度関数はどうなるでしょうか。
この手の問題で困ったら、分布関数に立ち戻って考えるとうまくいくことが多い気がします。
\(P(Z<z)=p\left(\frac{x}{y}<z\right)\)
となります。ここでYの値が正か負かで場合分けをして
\(X<zY(Y>0), X>zY(Y<0)\)
そうすると、それぞれの値の範囲で同時確率密度関数\(f(x,y)\)を積分することでZの確率分布関数を求めることができます。
\(F_Z(z)=\int_{-\infty}^0 dy \int_{zy}^\infty dx f(x,y) + \int_0^\infty dy \int_{-\infty}^{zy} dx f(x,y)\)
あとはこれをzで微分して
\(f_Z(z)=-\int_{-\infty}^0 dy f(zy,y) y + \int_0^\infty dy f(zy,y) y\\= \int_{-\infty}^\infty |y| f(zy,y) dy\)
となります。
具体的な例として標準正規分布の比がコーシー分布となる、という問題があります。
確率分布同士のいろんな関係性がわかると面白いですね。
参考文献:
Ratio distribution – Wikipedia
比の分布が説明された英語版Wikipediaです
比の分布に関して書いてあるブログです、参考になりました
『現代数理統計学の基礎』
コメントを残す