周辺確率関数・条件付き確率関数・条件付き期待値・条件付き分散・全分散の公式【統計検定1級対策】

過去問を解いていて２回くらい概念がごちゃごちゃしたので、周辺確率密度関数と条件付き確率密度関数から条件付き期待値、条件付き分散をざっと定義まとめます。

周辺確率関数

まずは周辺確率関数から。X、Yを2つの確率変数の組として考えます。

同時確率関数は

\(f_{X,Y}(x,y)\)

で表されます。

このときyの周辺確率関数は

離散型確率変数の場合

\(f_Y(y)=\sum_{x=0}^\infty f_{X,Y}(x,y)\)

連続型確率変数の場合

\(f_Y(y)=\int_{-\infty}^\infty f_{X,Y}(x,y)dx\)

となります。

条件付き確率関数

条件付き確率関数は以下の式で定義されます。先ほどと同様の例において\(X=x\)であるという条件のもとで

\(f_{Y|X}(y|x)=\frac{f_{X,Y}(x,y)}{f_X(x)}\)

となります。

条件付き期待値

条件付き期待値は条件付き確率関数に対して、そのまま期待値計算をすれば良いです。

離散型の場合

\(E[Y|X=x]=\sum_{y=0}^\infty yf_{Y|X}(y|x)\)

となります。

連続型では

\(E[Y|X=x]=\int_{-\infty}^\infty yf_{Y|X}(y|x)dy\)

となります。

条件付き期待値であることを明示するときは

\(E^{Y|X}[Y|X=x]\)

という書き方もするようです。

なお、よく用いられる変換として

\(E[Y]=E[E[Y|X]]\)

というものがあります。

実際中身を見てみますと

\(右辺=E[\sum_{y=0}^\infty yf_{Y|X}(y|x)]\\=E[\sum_{y=0}^\infty\frac{yf_{X,Y}(x,y)}{f_X(x)}]\\=\sum_{x=0}^\infty\sum_{y=0}^\infty f_X(x)\frac{yf_{X,Y}(x,y)}{f_X(x)}\)

ここでシグマを交換すれば

\(\sum_{y=0}^\infty\sum_{x=0}^\infty yf_{X,Y}(x,y)=\sum_{y=0}^\infty yf(y)\\=E[Y]\)

となります。

連続型の場合も同様に積分の順序を交換できれば成立することがわかります。

条件付き分散

続いて条件付き分散です。

定義としては\(X=x\)の条件の時

\(V(Y|X=x)=E[(Y-E[Y|X=x])^2|X=x]\\=E(Y^2|X=x)-(E[Y|X=x])^2\)

となっています。

また全分散の公式というものがあり

\(V(X)=E[V(X|Y)]+V(E[X|Y])\)

という等式が成り立ちます。

どうしてこうなるのか右辺を分解してみてみます。

第1項は

\(E[V(X|Y)]=E[E[X^2|Y]-(E[X|Y])^2]\\=E[X^2]-E[ (E[X|Y])^2]\)

第2項は

\(V(E[X|Y])=E[ (E[X|Y])^2]-(E[X|Y])^2\\=E[ (E[X|Y])^2]-(E[X])^2\)

となり、足し合わせると左辺に等しくなることがわかります。

全部の確率や期待値、分散がわからないケースではこうした条件付き期待値や分散から求めることができるので、重宝されます。

参考文献：

リンク

シグマ計算を機械的に行うための３つの公式 | 高校数学の美しい物語

意外に難しい条件付き”分散” – ChunPom’s diary

統計学をどんどん自分で学んで深めたい、という方へのおすすめ書籍をこちらのページの下部にまとめております。初心者向けのものから応用まで幅広く読んでいますので参考にどうぞ。

2024.09.30

周辺確率関数・条件付き確率関数・条件付き期待値・条件付き分散・全分散の公式【統計検定1級対策】