前回に引き続いて統計検定1級に出てきやすい連続型確率分布・標本分布について、関係性と式を簡単にまとめてみます。
前回の記事はこちら
図にしてみる
各分布の式など
モーメント母関数
\(M_X(t)=E[e^{tX}]\\M’_X(t)=E[X]\\M”_X(t)=E[X^2]\)
①連続一様分布
②コーシー分布
\(f(x)=\frac{1}{\pi}\frac{1}{x^2+1}\)
*自由度1のt分布と等しい
*平均と分散、モーメント母関数は存在しない
③正規分布
\(f(x)=\frac{1}{\sqrt{2\pi}\sigma}exp\{-\frac{(x-\mu)^2}{2\sigma^2}\}\)
*超メジャー分布でありながら、ぱっと見が分かりにくい式ですが、expの手前にあるのは規格化(正規化)定数であり、expの部分を積分したときに、調整のため生じうるものと理解すると何となく意味が掴みやすいです。
\(M_X(t)=exp(\mu t+\frac{\sigma^2t^2}{2})\)
\(E[X]=\mu\)
\(V(X)=\sigma^2\)
\(N(\mu_X, \sigma^2_X)+N(\mu_Y, \sigma^2_Y)=N(\mu_X+\mu_Y, \sigma^2_X+\sigma^2_Y)\)
*分布の再生性がある
④対数正規分布
\(f(x)=\frac{1}{\sqrt{2\pi}\sigma x}exp\{-\frac{(logx-\mu)^2}{2\sigma^2}\}\)
*\(Y\sim(\mu, \sigma^2)\)の時、exp(Y)=Xと変数変換することで生み出される確率分布
*モーメント母関数は存在しない
\(E[X]=exp(\mu+\frac{1}{2}\sigma^2)\)
\(V(X)=exp(2\mu+\sigma^2)\{exp(\sigma^2)-1\}\)
*変数変換とガウス積分を使って導出できる
⑤多変量正規分布
相変わらず行列が苦手すぎるのと文量も増えそうなのでいったん割愛します
⑥ガンマ分布
\(f(x; \alpha,\lambda)=\frac{\lambda^\alpha}{\Gamma(\alpha)}x^{\alpha-1}exp\{-\lambda x\}\)
(λでなくβをパラメータとして持ってくる式が多いですが、指数分布と比較しやすくなるようにλにしました。なお、愛用の『現代数理統計学の基礎』ではβの逆数をパラメータにしているため混乱します。)
*次に出てくる指数分布を一般化したもの、としてみると複雑な式も覚えやすい。α=1としたものが指数分布と一致する。
*つまり、ガンマ分布はある一定数の時間においてイベントが複数回起きる確率分布として理解できる。(指数分布は「単位時間あたりλ回起きるイベントが期間xのうちに1回起きる可能性を示す分布」であるので、ガンマ分布は「単位時間あたりλ回起きるイベントが期間xのうちにα回起きる可能性を示す分布である」と言える)
以下のブログの説明がわかりやすかったです。
\(M_X(t)=(\frac{\lambda}{\lambda-t})^\alpha\)
*定義通りに計算して、ガンマ分布の総和が1になることを利用して導出
\(E[X]=\frac{\alpha}{\lambda}\)
\(V(X)=\frac{\alpha}{\lambda^2}\)
*モーメント母関数から導出可
\(Ga(\alpha_1, \lambda)+Ga(\alpha_2, \lambda)=Ga(\alpha_1+\alpha_2, \lambda)\)
*分布の再生性がある
*上述したガンマ分布の意味を考えるとαはバラバラでも良いが、λは一緒でないといけない理由がよくわかる
<補足>
ガンマ関数とは→「階乗」を一般化したもの
定義は\( \Gamma(\alpha)=\int_0^\infty x^{\alpha-1}e^{-x}dx \)
性質として
\(\Gamma(\alpha+1)=\alpha\Gamma(\alpha)\)
\(\Gamma(\frac{1}{2})=\sqrt{\pi}, \Gamma(1)=1\)
一つめの性質から、αが自然数を想定すれば階乗になることがわかる。
⑦指数分布
\(f(x)=\lambda exp(-\lambda x)\)
*ガンマ分布におけるα=1の場合となる
\(M_X(t)=\frac{\lambda}{\lambda-t}\)
\(E[X]=\frac{1}{\lambda}\)
\(V(X)=\frac{1}{\lambda^2}\)
*指数分布はハザード関数と関連しており、関係性を示す式変形については以下の記事の一部で以前にまとめました
⑧ワイブル分布
\(f(x; a,b)=abx^{b-1}exp(-ax^b) ただし、x\gt0\)
*指数分布においてイベントの発生確率と言えるλが、時間経過に伴って増えていくという仮定のもとに\(\lambda(x)=abx^{b-1}\)として得られる確率密度関数。λがずっと一定というのは確かに現実的ではないことの方が多いと思います。
*導出過程は以下
f(x)をハザード関数とすると
\(\lambda(x)=\frac{f(x)}{1-F(x)}\)
(ここまでの流れは上の記事と同様です)
両辺を積分して
\(\int_0^x\lambda(t)dt=\int_0^x\frac{f(t)}{1-F(t)}dt\)
これを変形すると
\(f(x)=\lambda(x)exp\{-\int_0^x\lambda(t)dt\}\)
ここに\(\lambda(x)=abx^{b-1}\)を代入すると最初に出てきた確率密度関数の式が得られます。
平均と分散の計算は別記事にしました↓
⑨カイ二乗分布
自由度をnとすると
\(f(x)=\frac{1}{\Gamma(\frac{n}{2})}(\frac{1}{2})^{\frac{n}{2}}x^{\frac{n}{2}-1}exp\{-\frac{x}{2}\}\)
*ガンマ分布の特殊形です。自由度nのカイ二乗分布は
\(Ga(\frac{n}{2}, \frac{1}{2})\)と一致します。
*n個の標準正規分布の和は自由度nのカイ二乗分布に従います。過去記事で書きました。
\(E[X]=n\)
\(V(X)=2n\)
*ガンマ分布と同様に考えれば簡単に求められます
\(Ga(\frac{n}{2}, \frac{1}{2})+Ga(\frac{m}{2}, \frac{1}{2})=Ga(\frac{n+m}{2}, \frac{1}{2})\)
*分布の再生性がある
⑩t分布
\(f(x)=\frac{\Gamma(\frac{m+1}{2})}{\Gamma(\frac{m}{2})}\frac{1}{\sqrt{\pi m}}\frac{1}{(1+\frac{x^2}{m})^{\frac{m+1}{2}}}\)
モーメント母関数はなし
\(E[X]=0\)
\(V(X)=\frac{m}{m-2}\)
ただし1≦m<2の時は無限大
定義としては
\(Z\sim N(0,1), U\sim\chi^2_m\)のとき
\(T=\frac{Z}{\sqrt{\frac{U}{m}}}\)
⑪F分布
自由度(m,n)のF分布の確率密度関数は
\(f(x)=\frac{\Gamma(\frac{m+n}{2})}{\Gamma(\frac{m}{2})\Gamma(\frac{n}{2})}\frac{(\frac{m}{n})^\frac{m}{2}x^{\frac{m}{2}-1}}{(1+(\frac{m}{n})x)^{\frac{m+n}{2}}}\)
\(E[X]=\frac{n}{n-2}\)
\(V(X)=\frac{2n^2(m+n-2)}{m(n-2)^2(n-4)}\)
定義としては
\(S\sim\chi^2_m, T\sim\chi^2_n\)のとき
\(X=\frac{\frac{S}{m}}{\frac{T}{n}}\)
*期待値・分散の導出の方法は以下のサイトが参考になります。定義に戻ってカイ二乗分布の期待値をもとに考えると、\(E[\frac{1}{T}]\)を考えればなんとかなることが分かります。自由度のm,nが当ブログと逆なのでご注意ください。
F分布の期待値・分散をカイ二乗分布を用いて導出 | AVILEN AI Trend
⑫ベータ分布
\(f(x; a,b)=\frac{1}{B(a,b)}x^{a-1}(1-x)^{b-1}\)
*ベータ関数の定義は
\(B(a,b)=\int_0^1x^{a-1}(1-x)^{b-1}dx\)
またガンマ関数と以下の式のような関連があります。
\(B(a,b)=\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}\)
ベータ関数とガンマ関数の関係性の証明は以下にまとめました。
\(E[X]=\frac{a}{a+b}\)
\(V(X)=\frac{ab}{(a+b)^2(a+b+1)}\)
*導出はややトリッキーでベータ関数の以下の性質が利用されます。
\(B(a+1, b)=\frac{a}{a+b}B(a, b)\)
上記の性質は以下のサイトが分かりやすいです。部分積分を使って変形していくことで導出します。
ベータ関数とは? ~ 性質と公式 ~ (証明付) – 理数アラカルト –
期待値と分散の詳しい導出方法は以下のサイトが参考になります。ただサイトの中のパラメータα’、βの「ガンマ分布」と書いてある部分は「ベータ分布」の間違いだと思います。
ベータ分布の期待値・分散の導出 | AVILEN AI Trend
参考文献:
有益なブログ発信ありがとうございます。連続分布の全体像に書かれているガンマ分布とカイ2乗分布の関係について確認です。(α,β)=(n/2,1/2)ではなく,(α,β)=(n/2,2)でよろしいでしょうか。
お手数ですが,ご確認よろしくお願い致します。分布の全体像を整理頂き,大変理解の助けになっています。
linoさん
コメントどうもありがとうございます。参考書によりガンマ分布のパラメータと数式が異なるため(α,β)=(n/2,2)と記載してあるものもありますが(『現代数理統計学の基礎』など)
この記事では他の多くの参考書と同様にガンマ分布をβ^α/gamma(α)*x^(α-1)exp(-βx)という形で表現しているため、カイ二乗分布は(α,β)=(n/2,1/2)になります。
過去ブログからの移転記事のため数式の画像データがリンク切れしてしまっており、誤解を生んで申し訳ありませんが、latex方式で書きなおしましたので
また記事中の部分をご確認いただけますと幸いです。よろしくお願いいたします。