今日は、公式を復習しつつ、共分散と相関係数に関連した事項と過去問をみてみようと思います。
2014-2017年の過去問をみる限りは意外と相関係数の問題はあまり出ていないんですよね。2017年の問5くらいでしょうか。
ただ出題範囲ではありますし、出てもおかしくないところではあるので、必要な公式と式変形を見直してみます。
定義とか概念はもっと分かりやすいページがいっぱいある(こことか→相関係数とは何か。その求め方・公式・使い方と3つの注意点|アタリマエ!)と思うので、検定対策という点とそれぞれの相関係数の特徴(パラメトリックかノンパラメトリックか)をみていく記事にしていきます。
目次:
共分散の式変形
相関係数を出すのに必要な共分散について、まず見直してみます。ある確率変数 \(X\) と \(Y\) の共分散 \(\text{Cov}(X,Y)\) は以下の式で定義されます。
\[
\text{Cov}(X, Y)=E[(X-E(X))(Y-E(Y))]\\
=E[XY+XE(Y)-YE(X)+E(X)E(Y)]\\
=E[XY]-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)\\
=E[XY]-E[X]E[Y]
\]
となります。最後の形のほうが使いやすいのでこちらを用いることが多いと思います。
ピアソンの相関係数
まずはこの共分散を使ってピアソンの相関係数の式をみていきます。
ピアソンの相関係数とはパラメトリックな分布をとる連続変数どうしの関連性を見る際に使われる相関係数です。ただ、「相関係数」と言う場合もこれを指します。
式としては分子に共分散、分母にそれぞれの標準偏差を持ってきます。
具体的な式として書くと
\[
r=\frac{\text{Cov}(X,Y)}{\sigma_x\sigma_y}\\
=\frac{\text{Cov}(X,Y)}{\sqrt{\frac{1}{n}\sum(X_i-E[X])^2}\sqrt{\frac{1}{n}\sum(Y_i-E[Y])^2}}
\]
となります。
ここで実際の統計検定の問題を解くうえで注意が必要なのは、分子の標準偏差を \( n \) で割るか \( n-1 \) で割るかということ。 \( n-1 \) で割る場合は不偏分散ですが、 \( n \) で割る場合は標本分散です。
この式は \( n \) で割ったものを提示しています。というのも上記の式の共分散の定義は、期待値を用いている(期待値は \( n \) で割っている)ことから分かるように、標本分散と同様に \( n \) で割ったものだからです。
実際、分子分母間で統一されていれば、結局全部約分されるので、 \( n \) でも \( n-1 \) でもどちらでも同じです。ただ両方で統一しなければいけません。
何が困るかというところを、過去問で具体的にみてみます。
統計検定1級でみる過去問の事例
先日の記事でも書いた2015年の問2の続きである(2)を例にしてみてみます。
(2)は相関係数が以下の式で表せることを示す問題です。
\[
r=\frac{\sqrt{n_1n_2}(\bar y_1-\bar y_2)}{\sqrt{n(n-1)s^2}}
\]
ここで注意しなければいけないのは、最終的に示したい式で用いる \( s^2 \) が不偏分散であることです。つまり \( n-1 \) で割っています。そうするとこれを用いる以上は全て \( n-1 \) で割る方向で統一した方が良いです。
あとは愚直に相関係数の公式に従って求めていきますが、 \( n-1 \) で割る形に補正をしていきます。
\[
x_i=a(i=1,2,…,n_1), \quad x_i=-a(i=n_1+1,…,n)
\]
とおいて考えていくと
例えば、相関係数の分子は
\[
\text{Cov}(X,Y)=E[XY]-E[X]E[Y]
\]
となりますが \( n-1 \) で割る形に補正して
\[
\frac{n}{n-1}(E[XY]-E[X]E[Y])
\]
となります。
分母となる標準偏差の計算も以下の公式を使って出しますが
\[
V(X)=E[X^2]-(E[X])^2
\]
これも同様に不偏分散への変換が必要なので
\[
\frac{n}{n-1}\{E[X^2]-(E[X])^2\}
\]
という式にすることが必要です。
あとは相関係数の式に従って当てはめるだけ、となります。
うっかりここで \( n \) で割るか、 \( n-1 \) で割るかを間違えると答えにたどり着けなくなるので、同様の問題が出た時はちょっと落ち着いて考える必要がありそうですね。
統計検定で出るとしたら問題としても出しやすいので、今回紹介したピアソンの相関係数になると思いますが、続いて次回は範囲にはなっているので、スピアマンの相関係数をみていきます。
参考文献:
![日本統計学会公式認定 統計検定 1級 公式問題集[2014〜2015年] 日本統計学会公式認定 統計検定 1級 公式問題集[2014〜2015年]](https://m.media-amazon.com/images/I/51EriqDktIL._SL160_.jpg)
日本統計学会公式認定 統計検定 1級 公式問題集[2014〜2015年]
- 発売日: 2019/10/04
- メディア: オンデマンド (ペーパーバック)
楽天ユーザーの方はこちら
![現代数理統計学の基礎 (共立講座 数学の魅力 11) [ 久保川 達也 ] 現代数理統計学の基礎 (共立講座 数学の魅力 11) [ 久保川 達也 ]](https://thumbnail.image.rakuten.co.jp/@0_mall/book/cabinet/1660/9784320111660.jpg?_ex=128x128)
現代数理統計学の基礎 (共立講座 数学の魅力 11) [ 久保川 達也 ]
- 価格: 3520 円
- 楽天で詳細を見る
コメントを残す