Youtube更新しました。
チャンネルはこちら
今回は分散・標準偏差についてです。
中高生ぐらいの頃に初めて分散という概念を聞いた時は「データのばらつきなんて求めて何になるのだろう」と何も感じていなかったのですが、統計的仮説検定、95%信頼区間といった医療統計で特に重要な概念に通じていくので、論文を読む上でも理解は必須だと思います。
ちなみに歪んだ分布だとSDが使いにくいと動画内で述べていますが、チェビシェフの不等式というものを使うと、歪んだ分布だとしても
平均を中心として
±2SD範囲内に少なくとも約75%のデータが含まれる
±3SD範囲内に少なくとも約89%のデータが含まれる
±4SD範囲内に少なくとも約94%のデータが含まれる
ということが言えます。大雑把なのでもっと多くのデータが含まれている場合もあり、あくまで目安程度ですね。
次回は歪んだ分布のばらつきの指標である四分位範囲(interquartile range; IQR)について、やっていきます。
コメントを残す