2021年統計数理の解答例 問3【統計検定1級対策】

問題の概要と解答例

問3は超幾何分布とベイズ法を用いた問題でした。問題後半の”ベイズ”という言葉に思わずびびってしまい本番は選択しなかったのですが、計算量もさほど多くなく、この問題は選ぶべきでしたね・・・。ベイズ法は実はそこまで手計算を複雑に求めることはできないのではないかと思っているので、今後もベイズアレルギーは治したほうが良さそうです。ニーズから考えて来年もひとつは出題されるでしょうし。

では解答例を作っていきます。

(1)

これは単純に超幾何分布の確率関数を作るだけですね。

\(P(X=x)=\frac{_{N_A}C_x・_{100-N_A}C_{15-x}}{_{100}C_{15}}\)

ここで注意すべきことはxの範囲がある程度決まっている点です。

豆Aの数があまりにも多い場合は\(N_A-(100-15)\)が最小となります。
例えば豆Aが100個あれば必然的に15個全てが豆Aになるのが分かりますね。
豆Aがそこまで多くなければ最小は0です。

同様に最大値についても制限があります。15個より豆Aが少なければ必然的にそこまでで頭打ちとなりますので最大値は豆Aの数そのもの\(N_A\)となります。そうでなければ15です。

以上を記号を使ってまとめますと

\(min(0, N_A-85)\leq x\leq Max(15, N_A)\)

となります。

(2)

最尤推定値を求める問題ですが、ヒントに沿ってやればこれも簡単です。

まず尤度関数はさきほどの式に4を当てはめればよく

\(L(N_A)=\frac{_{N_A}C_x・_{4}C_{11}}{_100C_15}\)\)

ヒントに沿っていくと

\(\frac{L(N_A+1)}{L(N_A)}\\=\frac{_{N_A+1}C_4・_{100-N_A-1}C_{11}}{_{N_A}C_4・_{100-N_A}C_{11}}\\=\frac{N_A+1}{100-N_A}\frac{89-N_A}{N_A-3}\lt1\)

となります。

あとはこれを満たすNAを見つければよいので、式を整理すると

\(389\lt15N_A\\25.9…\lt N_A\)

となるので、徐々に増加していた尤度関数は26をピークにして減少していくことがわかります。

最尤推定量というのは名前のとおり最も尤度が大きいわけですので、答えは26となります。

(3)

さてここからベイズ法に入りますが、初めの問題では正規化定数を求めるだけなので、あまり関係ありません。離散型の確率関数ですので、すべて足し合わせて1となるように求めるだけです。

\(\sum_{n=0}^{100}C(n+1)=1\\\frac{1}{2}100・101+101C=1\\C=\frac{1}{5151}\)

となります。

(4)

ここでようやくベイズ。観測されたXの値から豆の粒数Nを推測するための事後分布を考えます。これは

\(\pi(N_A=n|X=4)=\frac{\pi(N_A=n)f(X=4|N_A=n)}{f(X=4)}\)

から求まります。

ベイズ法ではパラメータに関連しない正規化定数を省くことがよくみられます。この問題でも省いてよいとされているので、先ほどの式の分母は無視して比例の記号を用いて書きます。

よって求めたい事後分布は

\(\pi(N_A=n|X=4)\propto\frac{_{N_A}C_4・_{100-N_A}C_{11}}{_100C_15}(N_A+1)(4\leq N_A\leq89)\)

となります。(1)の答えに4を代入したものと(3)の事前分布を掛け合わせただけですね。なお、X=4が確定していますのでNAの範囲には注意しなければいけません。

最後の事後モードですが、事後分布が最大となる点を(2)の要領で行えば求めることができます。

\(\frac{_{N_A+1}C_4・_{100-N_A-1}C_{11}(N_A+2)}{_{N_A}C_x・_{100-N_A}C_{11}(N_A+1)}\lt1\)

あとは気合の限り計算を進めていきますと最終的に

\(29.875\lt N_A\)

となるので、(2)と同様に答えは30となります。

コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)