【医療統計YouTube】95%信頼区間【第8回】

今回もまたなかなか時間を要してしまいましたが、新しいyoutube動画公開しました。

今回のテーマは95%信頼区間です。

その意味がどうしても取りづらい概念で、統計学の歴史に詳しい『統計学を拓いた異才たち』を見ても、初めて学会発表された際の混乱した様子がうかがえます。

この本では1934年に区間推定の生みの親であるイェジー・ネイマンが発表したときのA.L.Bowleyという統計学者の反応が書かれています。

「これは、われわれが必要とすることーサンプリングにおける母集団に対して、その信頼区間が一定の範囲内に収まる可能性ーを示してくれるのだろうか。そうではないのだろうか、いや、私は自分の考えを適切に表現できているのかどうかさえも、よくわからない。しかし、この方法が初めて示された時から、どうも問題があるように思えてならない。この理論の展開は説得力がないので、自分が納得できるまで信頼区間の妥当性を疑わざるを得ない。」(『統計学を拓いた異才たち』第12章「信用」詐欺より引用)

うーん、何を示すものなのかよくわからない気持ちになっていたわけですね。実際のところ、この区間推定は”一定の範囲内に収まる可能性”を示す指標ではないので、名前に反していて理解しにくいのかと思います。

ここで数式が理解できると本質的な意味がもう少し分かりやすくなり、動画で紹介していたような仮説検定と対応した概念ということもよくわかります。以下に一度式の流れを書いてみますので、細かい数式はわからない人でも気にせずに雰囲気だけみてもらえるとよいかもしれません。

数式的な補足

例として中心極限定理を用いて正規分布に近似できるようなサンプル数を集めた標本平均\bar Xがあったとします。

この標本平均は平均\muと分散\frac{\sigma^2}{n}(母分散は\sigma^2)に従う正規分布となります。

ここで

帰無仮説H_0:\mu=\mu_0

対立仮説H_1:\mu\neq\mu_0

であるとして、有意水準5%の統計学的仮説検定を行います。つまり母平均が\mu_0であるという仮説を検定するわけです。

すると受容域、つまり母平均が\mu_0であることを正しいとする場合は

-1.96\leq\frac{\sqrt n(\bar X-\mu_0)}{\sigma}\leq1.96

と示されます。

ここで母平均を不等号の中心にして式を変形すると以下のようになります。

\bar X-1.96\frac{\sigma}{\sqrt n}\leq\mu_0\leq\bar X+1.96\frac{\sigma}{\sqrt n}

つまり信頼区間の算出はもともとの仮説検定の式を変形しただけなんですね。数学的には全くの同値であることがわかります。こうみると標本平均±1.96標準誤差を示す式になっていることも理解できます。

さらに細かいことを言えばこの標本平均\bar Xは実現値ではなく変数です。統計学では小文字で実現値を書くことになっていますので(\bar xという感じ)実現値を代入したら、この不等式を満たすか満たさないかはひとつに決まります。つまり、動画で述べていたように、この式があらわすことは母平均がこの範囲をとる確率が95%ではないということですね。

なお、今回は分散が既知としていますが、実際は未知のことが多いのでここも推定値を用いて計算することになります。

ちなみに、パラメータを含む確率が95%と区間というものも実はありまして、ベイズ信用区間(Bayesian credible interval)と言われています。ベイズ統計では「母平均は固定されたもの」とは考えず、確率分布に従うものとみなすため、パラメータを含む確率が95%となるような区間を求めることができます。ただ、こちらはその扱うモデルによって値も変わりうるため、いわゆる頻度主義で扱う“真の値“かどうかはよく分かりません。(2022.04.02追記修正)

ベイズの法則に出てくる事前確率・事後確率と同様に事前分布・事後分布という確率の分布を想定するため、事前分布に何を用意するかによって変化しますから、ここで出てくる95%信頼区間とは基本的に異なる数値となります。

参考文献: