※ブログ記事の商品・サービスリンクにはアフィリエイトリンクが含まれます。

現代数理統計学の基礎 5章 問12

二項分布を変数変換したときの、確率収束及び分布収束の問題ですね。

今まで解答の意味がよくわからなかったのですが、確率変数X_nがn→∞となるときにどう動くかは、前提として二項分布の母比率と標本比率の話がわかっておいた方が良さそうであることに後で気がつきました。

標本比率は母比率に確率収束する

母比率は二項分布におけるpのことです。それに対して標本比率は今回の設問の設定において\frac{X_n}{n}で表されます。n回施行のうち、X_n回が成功と出るわけなので、意味はよく分かります。

で、X_nそのものがn→∞のとき、どうなるかはわからないのですが、標本比率であれば、母比率に確率収束することが分かります。

というのも、\frac{X_n}{n}はそもそもベルヌーイ分布の標本平均と考えることができるので、1回の試行の結果をY_1, Y_2, ...,Y_n i.i.d.とすれば

\frac{X_n}{n}=\frac{1}{n}\sum Y_i

と表すことができます。

確率変数Yの期待値はp, 分散はp(1-p)となるので大数の弱法則より、その平均はpに収束することが分かります。

というわけでn→∞のとき\frac{X_n}{n}\to pとなります。

Y_n\to _plogpを示す

以上の前提から問題に取り掛かります。

まず上記の収束を示すには十分に小さい適当な定数ε>0をとって

P(|Y_n-logp|)\gt\epsilon\to0

を示せば良いことが分かります。

P(|Y_n-logp|\gt\epsilon)\\=P(|Y_n-logp|\gt\epsilon|X_n=0)+P(|Y_n-logp|\gt\epsilon|X_n\geq1)

ここでまず第1項は

P(|Y_n-logp|\gt\epsilon|X_n=0)\\=P(|1-logp|\gt\epsilon|X_n=0)\\=P(X_n=0)\\=(1-p)^n

となります。0<p<1なので、|1-logp|\gt\epsilonはいつでも成り立つことが分かります。

n→∞とすると0に収束します。

次に第2項をみていきます。

P(|Y_n-logp|\gt\epsilon|X_n\geq1)\\=P(|log\frac{X_n}{np}|\gt\epsilon|X_n\geq1)

Pの中身を検討すると

\(log\frac{X_n}{np}\lt-\epsilon, \epsilon\lt log\frac{X_n}{np}|\\\frac{X_n}{n}\lt pe^{-\epsilon}, pe^{\epsilon}\lt\frac{X_n}{n}\\\frac{X_n}{n}-p\lt p(e^{-eipsilon}-1), p(e^{\epsilon}-1)\lt\frac{X_n}{n}-p\)

となります。

n→∞のとき

\frac{X_n}{n}-pは0に収束しますが

p(e^{-\epsilon}-1)は負になり

p(e^{\epsilon}-1)は正になるため

不等号を満たす確率は0になります。

よって第2項も0に収束します。

以上から

P(|Y_n-logp|)\gt\epsilon\to0が示せました。

続いて

\sqrt n(Y_n-logp)\to_dN(0, \frac{1-p}{p})を示します。

前半の問題と同様に場合わけをまず行います。今回は連続型確率分布の話となるので定義関数Iを用いて

\sqrt n(Y_n-logp)=\sqrt n(Y_n-logp)I(X_n\geq1)+\sqrt n(Y_n-logp)I(X_n=0)

と表すことができます。

第2項については前半の問題と同様にみていくと

\sqrt n(Y_n-logp)I(X_n=0)\\=(1-logp)\sqrt nI(X_n=0)

ここで

P(\sqrt nI(X_n=0)\gt \epsilon)\\=P(I(X_n=0)\gt\frac{\epsilon}{\sqrt n})\\P(X_n=0)\\=(1-p)^n\to0

となります。

よって、第1項のみに着目して話を進めます。

ここで使うのがテイラー展開です。目的となる確率密度関数をテイラー展開していきます。二次の項まで展開して


\(log\frac{X_n}{n}\approx logp+\frac{1}{p}(\frac{X_n}{n}-p)\)

よって

\(\sqrt n(log\frac{X_n}{n}-logp)\approx\frac{\sqrt n}{p}(\frac{X_n}{n}-p)\\=\frac{1}{p}\sqrt n(\frac{X_n}{n}-p)\)


ここで、\frac{X_n}{n}は平均p、分散p(1-p)なので中心極限定理より

_dN(0, p(1-p))に収束します。

先程の式はそこに\frac{1}{p}がついてますので

_dN(0, \frac{1-p}{p})に収束することが分かりました。

*2023.08.31 一部誤っていたため式を修正しました

4件のコメント

お初コメント致します、名無しとでも名乗らせてください。
いつも記事を参考に勉強させていただいております。

もしお手すきでしたら教えていただきたいのですが、

本記事後半の、分布収束を求める部分でLog(Xn/n)をテイラー展開しておりますが、
どう変形してLog(p) – (1/p)*((Xn/n) -p)になるか追えませんでした。

一般に -1 < x < 1 のxに対して、Log(1+x) ~ x – (1/2)*x^2 + ・・ と展開できますが
どう見ればよいか分かりませんでした。

ネット上の他の解答よりも脳ラブさんのものがしっくり来ていまして、
お手数ですがぜひご回答いただけますと幸いです。

よろしくお願いいたします。
最後になりますが、これからも更新楽しみにしています。

9:46PMにメールしたものです、名無しです。

すみません、テイラー展開という言葉に引っ張られていましたがデルタ法で近似していたんですね
理解できました、、。
従いましてご回答をお願いしますなどと申してしまいましたが、解決致しました。

連投失礼致しました。
今後とも記事投稿応援しております、暑い日が続きますが体調にお気をつけてください。

コメントありがとうございます。
見直してみましたが、期待値や分散の計算ではないのでデルタ法と言うよりはテイラー展開でやはり良いように思いました。上記の式ではf(x)=logxとして平均回りでテイラー展開しています。(実際はX_n/nですが簡略化のためにxとしておきます)

f(x)≒f(p)+f’(p)(x-p)+…

ですので

f(x)≒logp+1/p(x-p)+…

となっています。右辺の第二項が誤ってマイナスとなっていましたのでそちらで誤解を生んでしまったかもしれません。申し訳ありませんでした。

返信ありがとうございます!

確かにおっしゃる通りpまわりのテイラー展開ですね、、
logを見て反射的にデルタ法と書き込んでしまっていました
(回答に対する感謝の意だけですので返信不要です!)

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)