t分布とstudentのt検定、不偏分散との関連を整理する【統計検定1級対策】

さて、過去問解きつつも、全くもって受かる気がしてこない統計検定1級ですが、引き続きあがいていこうと思います。というかコロナの影響で6月の検定やられてないのですが、果たして11月はやるんでしょうか。

今回はt分布の確率密度関数とt検定のやり方について、数式を整理してみます。

目次：

t分布と不偏分散の関係
t検定の種類
studentのt検定

t分布と不偏分散の関係

以前の記事で書いたようにt分布は「母分散が分からない」という極めてよくあるシチュエーションで役に立ちます。

ここで用いられるのが、以前の記事で紹介した不偏分散とχ二乗分布の関係性です。

標本平均と不偏分散、カイ2乗分布の関係性を整理【統計検定1級対策】

\[ \frac{(n-1)V^2}{\sigma^2}\sim\chi_{n-1}^2 \]

上記の式の関係性からカイ二乗分布に従う確率変数をUとすると以下の式が導出できます。

\[ \frac{(n-1)V^2}{\sigma^2}=U \\ V=\sigma\sqrt{\frac{U}{n-1}} \]

これをあとで使っていきます。

まず、標準正規分布に従う確率変数Zは以下の式で表現されます。

\[ Z=\frac{\sqrt{n}(X-\mu)}{\sigma} \]

これの分母を不偏分散Vにすり替えてみます。

\[ \frac{\sqrt{n}(X-\mu)}{V} \]

この式の分布が特定できれば、不偏分散を使った確率変数の分布が分かるので、いろいろと便利そうです。ここで、最初につくった式を入れてみます。

\[ \frac{\sqrt{n}(X-\mu)}{V}=\sqrt{n}(X-\mu)×\frac{1}{\sigma\sqrt{\frac{U}{n-1}}} \\ =\frac{Z}{\sqrt{\frac{U}{n-1}}}=T \]

この確率変数Tが自由度\(n-1\)のt分布に従います。

ちなみに自由度に応じてt分布は変形していきますが、自由度1の時はコーシー分布という分布に従い、∞のときは標準正規分布になっていきます。

確率密度関数とその導出は正直書くのが大変なので省略します。すみません。

t検定の種類

t分布の話から一番基本的なstudentのt検定について説明します。

一口にt検定といっても色々な種類がありますが、studentのt検定は2標本の比較で、母集団が正規分布、母分散が等しい、標本における対応なし（同じ被験者・被験体ではない）ということが前提となります。

統計検定1級の教本をみると、「一般な条件 \(\sigma_1^2\neq\sigma_2^2\) の場合の理論的な結果（いわゆるベーレンス-フィッシャー問題）は本書の程度を超えるので・・・(統計検定1級対応統計学 p.106第4章仮説検定より引用)」とあるので、一応今回説明するstudentのt検定が分かっていればカバー範囲としては問題ないのかなと思ってます。

混乱しがちなので（自分が）、他のt検定と合わせて一度図にまとめておきます。