※ブログ記事の商品・サービスリンクにはアフィリエイトリンクが含まれます。

小ネタ集<コーシー・シュワルツの不等式、算術平均・幾何平均・調和平均、二項定理>【統計検定1級対策】

もともと数学は大の苦手分野なので、数学的な有名定理も全く馴染みがないのですが、統計検定の問題において必要とされることがあるので、自分向けの備忘録としてまとめておきます。

ひとまず目についたところでコーシー・シュワルツの不等式、算術平均・幾何平均・調和平均、二項定理についてです。証明とかはもっと遥かにわかりやすいサイトがいっぱいあるのでやりません笑

目次:

コーシー・シュワルツの不等式

コーシー・シュワルツの不等式とは以下のような式で表されます。*1

\[
\left(\sum_{i=1}^{n} x_i y_i \right)^2 \leq \left(\sum_{i=1}^{n} x_i^2 \right) \left(\sum_{i=1}^{n} y_i^2 \right)
\]

ベクトルの話として出てくることも多いようですが、数理統計学で見るとこの形が使いやすいと思われます。

具体例

統計検定1級、2016年統計数理の問3、線形モデルにおける \( \beta \) の不偏推定量のうちどれが最も分散が小さいかを求める問題で、利用されていました。

また、相関係数の絶対値が1以下となることはコーシー・シュワルツの不等式から導き出せます。

\[
|Corr(X,Y)| \leq 1
\]

相関係数の定義に戻ると共分散を用いて

\[
Corr(X,Y) = \frac{Cov(X,Y)}{\sqrt{Var(X) Var(Y)}}
\]

よって証明したい最初の不等式は

\[
\{ Cov(X,Y) \}^2 \leq Var(X) Var(Y)
\]

これを実際の式に直すと

\[
\left(E[(X-\mu_X)(Y-\mu_Y)]\right)^2 \leq E[(X-\mu_X)^2] E[(Y-\mu_Y)^2]\]

これはコーシー・シュワルツの不等式から導き出せますので、証明できました。

算術平均・幾何平均・調和平均

正の実数 \( a_1, a_2, \dots, a_n \) において

算術平均≧幾何平均≧調和平均

が基本的に成り立ちます。*3

そもそも算術平均とか幾何平均とかなんやねんという自分のような素人用に簡単に書きます。

算術平均は一般的に平均と呼ばれているもので

\[
\frac{a_1 + a_2 + \dots + a_n}{n}
\]

で表されます。

外れ値の影響を受けやすいのが特徴で、大きく他と異なる数値がある場合にそちらに引っ張られます。

続いて幾何平均

\[
\sqrt[n]{a_1 a_2 \dots a_n}
\]

と表されます。

対数の算術平均を指数変換したもの、という事もできます。

つまり

\[
\frac{\log a_1 + \log a_2 + \dots + \log a_n}{n}
\]

を指数変換したということですね。

偏った分布を左右対称に近づける性質があるので、算術平均よりは外れ値に強くなります。

最後に調和平均です。

\[
\frac{1}{\frac{1}{n} \left( \frac{1}{a_1} + \frac{1}{a_2} + \dots + \frac{1}{a_n} \right)}
\]

逆数の算術平均をとり、その逆数をとります。

使われる例として、平均速度の話*3やピタゴラス音階*5においてハーモニー(調和)を生み出す波長の関係性などがあります。あとは投資においてリスク低減すると言われているドルコスト平均法の平均取得単価*3なんかも調和平均の形をとります。

こちらも2016年統計数理の問3で使われてましたので、知っておいて損はないかもしれません。大小を決める問題では応用が効く場合があると思います。

二項定理

二項の累乗を表す式を展開する際に役立つ公式です。

\[
(a+b)^n = \sum_{k=1}^{n} {_nC_k} a^k b^{n-k}
\]

と表されます。

2項分布の総和が1になる(=確率変数である)ことを示す際に用いられます。

Bin(n,p) で考えると

\[
\sum {_nC_k} p^k (1-p)^{n-k} = (p + 1 – p)^n \\
= 1
\]

と導けます。

似たものに多項定理というものもあります。

\[
(p_1 + p_2 + \dots + p_k)^n = \sum_{x_1 + x_2 + \dots + x_k = n} \frac{n!}{x_1! x_2! \dots x_k!} p_1^{x_1} p_2^{x_2} \dots p_k^{x_k}
\]

と表されます。

こちらは多項分布の総和が1になることに用いられます。

参考文献:

*1

コーシー=シュワルツの不等式 – Wikipedia

*2

『現代数理統計学の基礎』

*3

https://mathematics-pdf.com/pdf/agh_means.pdf

*4

『入門統計学 検定から多変量解析・実験計画法まで』

*5

調和平均とハーモニー、と新たな謎

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)