※ブログ記事の商品・サービスリンクにはアフィリエイトリンクが含まれます。

【統計応用】95%信頼区間と2標本両側t検定【統計検定1級対策】

2016年の統計応用(共通問題)でこんな問題が出てました。

「2つのデータの95%信頼区間と2標本両側t検定の有意差の関係性を調べよ」

これって医療統計本の中では屈指の出来である(と個人的に思っている)「今日から使える医療統計(新谷歩著)」*1に出てきた話で、「95%信頼区間のエラーバーが重ならないこととp値(=有意差)がどう関係するか」ということですね。

一応答えとしては

95%信頼区間が重ならない→有意差あり

95%信頼区間が重なる→有意差あるかないかは不明

となります。

図で書くとこんな感じ。

f:id:medibook:20210425061847j:plain

つまり、「95%信頼区間が重ならない」ことは「有意差がある」ことの十分条件ですね。ただ、必要条件ではない。

で、これが本当なのかどうかと思ってしまいますが、それを過去問と同じような例に沿いつつ、数学的にみてみようと思います。

問題設定

それぞれ独立した被験者を ( n ) 人ずつ集め、A と B のそれぞれの処置を行います。結果は連続変数のデータでグループ A のデータは

\[
x_1, x_2, \dots, x_n
\]

となり、グループ B のデータは

\[
y_1, y_2, \dots, y_n
\]

となりました。

各グループの平均を \( \bar{x}, \bar{y} \)、不偏分散による標本標準偏差をそれぞれ \( S_x, S_y \) とします。

5%の両側t検定を考えてみましょう。

実際に計算してみる

さて、まずは95%信頼区間が重ならないとはどういう状況かを数学的に表現します。
ここで \( \bar{x} \leq \bar{y} \) としても一般性を失わないので、こう仮定します。

すると \( x \) の平均値+95%CI と \( y \) の平均値−95%CI が重ならないわけなので、自由度 \( n-1 \), 2.5% 分位点の値を \( t_{0.025,n-1} \) とすると

\[
\bar{x} + t_{0.025,n-1} \frac{S_x}{\sqrt{n}} \lt \bar{y} – t_{0.025,n-1} \frac{S_y}{\sqrt{n}}
\]

となります。

さて、次に t 検定の検定統計量を考えてみると、サンプルサイズが同じという前提であるためプールされた分散は比較的小さくなり

\[
T = \frac{\bar{y} – \bar{x}}{\sqrt{\frac{S_x^2 + S_y^2}{n}}}
\]

となります。

ここで先程の 95%CI の不等式を当てはめると

\[
T = \frac{\bar{y} – \bar{x}}{\sqrt{\frac{S_x^2 + S_y^2}{n}}}
\gt \frac{t_{0.025,n-1} \frac{S_x}{\sqrt{n}} + t_{0.025,n-1} \frac{S_y}{\sqrt{n}}}{\sqrt{\frac{S_x^2 + S_y^2}{n}}}
= \frac{t_{0.025, n-1} (S_x + S_y)}{\sqrt{S_x^2 + S_y^2}}
\]

「有意差あり」となる場合は

\[
t \gt t_{0.025,2n-2}
\]ですので

\[
\frac{t_{0.025, n-1} (S_x+S_y)}{\sqrt{S_x^2+S_y^2}}
\]と大小比較してみます。

t分布のパーセント表をみるとわかりますが、自由度は高ければ高いほど、同じパーセントでも値は小さくなっていきます。

よって

\[
t_{0.025,n-1} \gt t_{0.025,2n-2}
\]

ですね。

さらに

\[
\frac{(S_x+S_y)}{\sqrt{S_x^2+S_y^2}}
\]

については、( S_x \geq 0, S_y \geq 0 ) より

\[
(S_x+S_y)^2 \geq S_x^2+S_y^2
\]

が成り立ちます。

よって

\[
\frac{(S_x+S_y)}{\sqrt{S_x^2+S_y^2}} \geq 1
\]

ですね。

以上のことから
\[
t_{0.025,2n-2} \lt \frac{t_{0.025, n-1}(S_x+S_y)}{\sqrt{S_x^2+S_y^2}} \lt T
\]

が成立し、95%信頼区間が重ならなければ、2標本両側t検定の有意差ありになることが示せました。

参考文献:

*1「今日から使える医療統計」

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)