「2つのデータの95%信頼区間と2標本両側t検定の有意差の関係性を調べよ」
これって医療統計本の中では屈指の出来である(と個人的に思っている)「今日から使える医療統計(新谷歩著)」*1に出てきた話で、「95%信頼区間のエラーバーが重ならないこととp値(=有意差)がどう関係するか」ということですね。
一応答えとしては
95%信頼区間が重ならない→有意差あり
95%信頼区間が重なる→有意差あるかないかは不明
となります。
図で書くとこんな感じ。

つまり、「95%信頼区間が重ならない」ことは「有意差がある」ことの十分条件ですね。ただ、必要条件ではない。
で、これが本当なのかどうかと思ってしまいますが、それを過去問と同じような例に沿いつつ、数学的にみてみようと思います。
問題設定
それぞれ独立した被験者を ( n ) 人ずつ集め、A と B のそれぞれの処置を行います。結果は連続変数のデータでグループ A のデータは
\[
x_1, x_2, \dots, x_n
\]
となり、グループ B のデータは
\[
y_1, y_2, \dots, y_n
\]
となりました。
各グループの平均を \( \bar{x}, \bar{y} \)、不偏分散による標本標準偏差をそれぞれ \( S_x, S_y \) とします。
5%の両側t検定を考えてみましょう。
実際に計算してみる
さて、まずは95%信頼区間が重ならないとはどういう状況かを数学的に表現します。
ここで \( \bar{x} \leq \bar{y} \) としても一般性を失わないので、こう仮定します。
すると \( x \) の平均値+95%CI と \( y \) の平均値−95%CI が重ならないわけなので、自由度 \( n-1 \), 2.5% 分位点の値を \( t_{0.025,n-1} \) とすると
\[
\bar{x} + t_{0.025,n-1} \frac{S_x}{\sqrt{n}} \lt \bar{y} – t_{0.025,n-1} \frac{S_y}{\sqrt{n}}
\]
となります。
さて、次に t 検定の検定統計量を考えてみると、サンプルサイズが同じという前提であるためプールされた分散は比較的小さくなり
\[
T = \frac{\bar{y} – \bar{x}}{\sqrt{\frac{S_x^2 + S_y^2}{n}}}
\]
となります。
ここで先程の 95%CI の不等式を当てはめると
\[
T = \frac{\bar{y} – \bar{x}}{\sqrt{\frac{S_x^2 + S_y^2}{n}}}
\gt \frac{t_{0.025,n-1} \frac{S_x}{\sqrt{n}} + t_{0.025,n-1} \frac{S_y}{\sqrt{n}}}{\sqrt{\frac{S_x^2 + S_y^2}{n}}}
= \frac{t_{0.025, n-1} (S_x + S_y)}{\sqrt{S_x^2 + S_y^2}}
\]
「有意差あり」となる場合は
\[
t \gt t_{0.025,2n-2}
\]ですので
\[
\frac{t_{0.025, n-1} (S_x+S_y)}{\sqrt{S_x^2+S_y^2}}
\]と大小比較してみます。
t分布のパーセント表をみるとわかりますが、自由度は高ければ高いほど、同じパーセントでも値は小さくなっていきます。
よって
\[
t_{0.025,n-1} \gt t_{0.025,2n-2}
\]
ですね。
さらに
\[
\frac{(S_x+S_y)}{\sqrt{S_x^2+S_y^2}}
\]
については、( S_x \geq 0, S_y \geq 0 ) より
\[
(S_x+S_y)^2 \geq S_x^2+S_y^2
\]
が成り立ちます。
よって
\[
\frac{(S_x+S_y)}{\sqrt{S_x^2+S_y^2}} \geq 1
\]
ですね。
以上のことから
\[
t_{0.025,2n-2} \lt \frac{t_{0.025, n-1}(S_x+S_y)}{\sqrt{S_x^2+S_y^2}} \lt T
\]
が成立し、95%信頼区間が重ならなければ、2標本両側t検定の有意差ありになることが示せました。
参考文献:
*1「今日から使える医療統計」
コメントを残す