順序統計量とその確率についてイメージしてみる【統計検定1級対策】

ここ最近の仮説検定の話から一旦離れますが、順序統計量の話をまとめます。

統計検定1級で時々出題されている内容ですが久々に解こうとすると、定理を忘れてしまってることが多くて困りました(汗

他の内容とそこまで強く関連しないので、どうしても内容が飛びやすいんですよね…。そこで簡単ですが図も交えて整理していこうと思います。

目次:

順序統計量とは

順序統計量とは、ある確率変数をその数値の大きさによって並べた時に得られる数値を扱うものです。

例えば、X_1, X_2,..., X_nのn個のデータがあった場合、それを大きい順から並べていってX_{(3)}という順序統計量の場合、得られた全ての確率変数の中から3番目に大きいものを指します。(()は区別するために、ついたりついてなかったり表記法は色々です)

そうなると知りたいのは、その何番目かに大きい確率変数が得られる確率はどうか?ということですよね。その求め方をこれから紹介していきます。

離散型確率変数の場合

まずはイメージしやすい離散型確率関数の例で考えてみます。

具体例として得られた確率変数Xの数が7つで、X_5以上となる確率を求めたい場合を考えてみましょう。X_5ぴったりとなる確率はこの後で導出します。

確率の式は

P(X_5\leq x_i) 

となります。

ここでX_5以上となるxの個数をyとおいてみます。図で表すとこんなイメージです。

f:id:medibook:20200722045511j:plain

 このときの確率P(Y\leq3)は先ほどの確率P(X_5\leq x_i)と状況的には全く同じであるため、P(Y\leq3)=P(X_5\leq x_i)であることがわかります。

さらに確率P(X_5\leq x_i)=P_iとおきます。この確率を満たしたときに成功として+1, 外れた時は失敗として0となるようなベルヌーイ試行を考えると、先ほどのyはそれに従う二項分布であると考えられます。

よって

P(Y\leq3)=P(X_5\leq x_i)=\sum_{k=5}^7nC_kP_i^5(1-P_i)^{7-5}

となります。

これを一般化してn個のデータからj番目の順序統計量が得られる確率を式にすると

P(X_j\leq x_i)=\sum_{k=j}^nnC_kP_i^k(1-P_i)^{n-k}

となります。

最後にP(X_j=x_i)の場合を考えると、P(X_j\leq x_i)-P(X_j\leq x_{i-1})を計算すれば良いので

 P(X_j\leq x_i)=\sum_{k=j}^n\{nC_kP_i^k(1-P_i)^{n-k}-nC_kP_{i-1}^k(1-P_{i-1})^{n-k}

になります。

以上が離散型の場合でした。

連続型確率変数の場合

離散型の同じ例で、n個のデータからj番目の順序統計量が得られる確率を考えてみます。

これは先ほどの離散型の場合を連続型関数に置き換えるとP(X_j\leq x)については簡単に分かります。

P(X_j\leq x)=F_{X_j}(x)=\sum_{k=j}^nnC_k\{F(x)\}^k\{1-F(x)\}^{n-k}

分布関数はこのように求まりますが、では確率密度関数はどうやるのでしょうか。

順序統計量を表す確率密度関数

結論から先に書くとこの式が順序統計量を表す確率密度関数です。

f_{X_j}(x)=\frac{n!}{(j-1)!1!(n-j)!}\{F(x)\}^{j-1}f(x)\{1-F(x)\}^{n-j}

導出の方法として先ほどの分布関数を微分するのが、正統な方法ですが、結構式が複雑になるので割愛して、正確ではないですが、イメージで覚えやすい方法を紹介します。

P(X_j\lt x), P(X_j=x), P(X_j\gt x)の3つの事象をそれぞれ考えてみます。離散型の例と同じように、条件を満たすデータXの個数に注目してみます。確率密度関数を縦軸、xを横軸にとったグラフをもとに考えてみると以下のようなイメージになります。

f:id:medibook:20200722051608j:plain

するとこれは、P(X_j\lt x), P(X_j=x), P(X_j\gt x)の3つの確率の事象の三項分布と考えることができます。面積が確率を表しており、条件を満たすXの個数を用いると上記の式が導出できます。

f_{X_j}(x)=\frac{n!}{(j-1)!1!(n-j)!}\{F(x)\}^{j-1}f(x)\{1-F(x)\}^{n-j}

個人的に疑問なのは、厳密にいうと3つの事象の確率を足し合わせても1にならないように見える(多項分布の確率の和は1にならないといけない)ことですが、f(x)は実際極限まで小さくなっているわけで面積は0として扱ってよいのかなと思ってます。

参考文献:

現代数理統計学の基礎 (共立講座 数学の魅力)

現代数理統計学の基礎 (共立講座 数学の魅力)

  • 作者:達也, 久保川
  • 発売日: 2017/04/07
  • メディア: 単行本
 

コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)