さてこの問題は指数分布に従う時間データのフィッシャー情報量や検出力、サンプルサイズ計算をする問題でした。割とオーソドックスな内容ですが、その分きちんと基本的な内容を押さえられていないと難しかった気がします。
[1]
尤度関数と最尤推定をする問題です。
観測値 \( T_i = t_i \) (\( i = 1, …, n \)) が得られたとき、尤度関数 \( L(\lambda) \) は次のように表されます:
\[
L(\lambda) = \prod_{i=1}^{n} \lambda \exp(-\lambda t_i) = \lambda^n \exp\left(-\lambda \sum_{i=1}^{n} t_i \right)
\]
対数尤度関数を求めると、
\[
\log L(\lambda) = n \log \lambda – \lambda \sum_{i=1}^{n} t_i
\]
これを \(\lambda\) で微分して 0 にすると、
\[
\frac{d}{d\lambda} \log L(\lambda) = \frac{n}{\lambda} – \sum_{i=1}^{n} t_i = 0
\]
最尤推定量 \(\hat{\lambda}\) は次の式で与えられます:
\[
\hat{\lambda} = \frac{n}{\sum_{i=1}^{n} t_i}
\]
これが \(\lambda\) の最尤推定量です。
[2]
フィッシャー情報量を求める問題です。こちらも基本的ですね。
フィッシャー情報量は、次のように定義されます:
\[
I_n(\lambda) = -\mathbb{E}\left[ \frac{d^2}{d\lambda^2} \log L(\lambda) \right]
\]
まず、対数尤度関数の2階微分を求めます:
\[
\frac{d^2}{d\lambda^2} \log L(\lambda) = -\frac{n}{\lambda^2}
\]
この期待値を取ると、フィッシャー情報量は次のようになります:
\[
I_n(\lambda) = \frac{n}{\lambda^2}
\]
[3]
さて、ここからが問題です。
帰無仮説 \( H_0: \lambda = \lambda_0 \) に対して、対立仮説 \( H_1: \lambda > \lambda_0 \) を検定する場合、検定統計量 \( Z \) は次のように定義されます:
\[
Z = \frac{\hat{\lambda} – \lambda_0}{\lambda_0 / \sqrt{n}}
\]
検定力 \(1 – \beta\) とは、対立仮説 \( H_1 \) のもとで検定統計量 \( Z \) が臨界値 \( Z_{\alpha} \) を超える確率を意味します。これは次のように表されます:
\[
P(Z \geq Z_{\alpha} \mid H_1) = 1 – \beta
\]
対立仮説の下では、検定統計量 \( Z \) は次のように分布します:
\[
Z \sim N(\mu, 1), \quad \mu = \frac{\lambda_1 – \lambda_0}{\lambda_0 / \sqrt{n}}
\]
この条件から次のような不等式が成り立ちます:
\[
P(Z – \mu \geq Z_{\alpha}- \mu) = 1 – \beta
\]
この結果、次のようにまとめられます:
\[
Z_{\alpha} – \mu = -Z_{\beta}
\]
よって、
\[
\mu = Z_{\alpha} + Z_{\beta}
\]
これにより、期待値 \(\mu\) が \( Z_{\alpha} \) と \( Z_{\beta} \) の和であることが証明されました。
[4]
検出力 \(1 – \beta\) を満たす条件は、対立仮説 \( H_1: \lambda > \lambda_0 \) のもとで、検定統計量 \( Z \) が臨界値 \( Z_{\alpha} \) を超える確率が1-βであれば良いので、次のように表されます:
\[
P(Z \geq Z_{\alpha} \mid H_1) = 1 – \beta
\]
先ほどと同様に検定統計量 \( Z \) は、\( H_0 \) と \( H_1 \) のもとで異なる分布に従います。具体的には、次のように定義されます:
- \( H_0 \) のもとで: \( Z \sim N(0,1) \)
- \( H_1 \) のもとで: \( Z \sim N(\mu_1,1) \)、ここで \( \mu_1 \) は次の式で与えられます:
\[
\mu_1 = \frac{\lambda_1 – \lambda_0}{\lambda_0 / \sqrt{n}}
\]
したがって、検出力条件は次のように書けます:
\[
P\left( \frac{\hat{\lambda} – \lambda_0}{\lambda_0 / \sqrt{n}} \geq Z_{\alpha} \mid H_1 \right) = 1 – \beta
\]
ここで
\[
\frac{\hat\lambda-\lambda_1}{\sqrt{I_n(\lambda_1)^{-1}}}\sim N(0,1)
\]
なので
\[
P(X\geq Z_\alpha+\frac{\lambda_0-\lambda_1}{\sqrt{I_n(\lambda_1)^{-1}}})=1-\beta
\]
よってフィッシャー情報量を当てはめて
\[
Z_{\alpha}+Z_{\beta}=\frac{\sqrt n}{\lambda_1}(\lambda_1-\lambda_0)
\]
この式を \( n \) について解くと、次のようになります:
\[
n = \frac{\lambda_1^2(Z_{\alpha}+Z_{\beta})^2}{(\lambda_1 – \lambda_0)^2}
\]
これが検出力 \(1 – \beta\) を満たすために必要な被験者数の式です。
[5]
累積分布関数 \( F(5) \) の値は次のように与えられます:
\[
H_0: 1 – \exp(-5 \lambda_0) = 0.5
\]
\[
H_1: 1 – \exp(-5 \lambda_1) = 0.75
\]
これをもとにλを計算し、(4)の式に代入して計算することで次の結果が得られます:
\[
n = 32
\]
コメントを残す