さて今年も残すところあとわずかとなってきました。
当ブログではせっせと統計検定1級合格を目指して勉強内容を記事にしたりしてきましたが、今年も統計検定1級に合格できず(まだ結果出てませんが、感触的には無理)このままだと来年以降も対外的に「統計検定1級を受けようとしているだけの人」になりかねません・・・。履歴書にもそれだけでは何も書けません。そこで、せめて「統計検定1級を受けようとしている多少統計を勉強している人」になるべく統計検定2級を受けてきました!(今更感がすごい)
そして無事合格してきたので、覚えているうちに勉強した内容と試験の概要、出題範囲、役に立つ参考書、当日の感想などまとめておきます。
統計検定2級を目指している人の参考になりましたら幸いです。
統計検定2級のために勉強した内容
出題範囲
基本的に統計検定1級に向けて勉強し続けていたので2級の内容は全然知らないところからスタートしています。11月末の1級の試験で昨年にも増して「あー落ちたな」という感じでしたので12月の初旬から準備して、中旬に受けました。
統計検定2級はCBT方式の試験でCBT方式の試験を扱う最寄りの会場であれば、いつでも受験が可能です。試験時間は90分、設問は全32問でした。ここ最近の合格率は概ね40%台となっています。
試験範囲は公式ページの出題範囲表の通りとなっています。
統計検定2級|統計検定:Japan Statistical Society Certificate
過去問の本も購入したので、最新版に載っている問題の分野については箇条書きでざっとまとめました。分野の配分は本番に近いので参考にはなるかと思います。
◇2021年
問1 分布と歪度
問2 年次変化率
問3 パーシェ指数
問4 前年比増加率
問5 散布図と相関係数
問6 相関係数と不偏分散
問7 抽出法
問8 同時確率関数と相関係数
問9 余事象の確率計算
問10 正規分布の確率導出
問11 累積分布関数(一様分布)
問12 チェビシェフの不等式、大数の法則(弱法則)
問13 推定量、一致推定量、不偏推定量
問14 不偏推定量、推定量の分散
問15 95%信頼区間、正規分布(分散既知)
問16 単回帰モデル、最小二乗法
問17 二項分布、正規近似
問18 分散の等しい2標本のt検定
問19 クロス表の独立性検定
問20 アルファエラー、ボンフェローニの不等式
問21 分散分析、分散分析における95%信頼区間
問22 重回帰モデル
◇2019年11月
問1 箱ひげ図
問2 散布図、相関係数、ヒストグラム
問3 変化率
問4 時系列データの変動
問5 コレログラム
問6 抽出法
問7 標準誤差
問8 ベイズ法
問9 確率密度関数と期待値導出
問10 分布関数
問11 歪度
問12 不偏推定量、一致推定量
問13 二項分布の正規近似、95%信頼区間
問14 相対度数分布表、t分布
問15 二項分布の正規近似、サンプルサイズ
問16 t検定
問17 分散分析
問18 重回帰モデル
◇2019年6月
問1 相対度数分布表
問2 散布図、共分散、変動係数
問3 標準化得点
問4 相関係数、偏相関係数
問5 フィッシャーの3原則
問6 標本抽出法
問7 独立・排反
問8 復元抽出の確率計算
問9 相関係数、共分散
問10 幾何分布
問11 正規分布
問12 t分布
問13 復元抽出、最頻値、標本平均、不偏推定
問14 母比率の95%信頼区間
問15 t分布の95%信頼区間、仮説検定
問16 アルファエラー、ベータエラー
問17 重回帰モデル
問18 重回帰モデル
◇2018年11月
問1 箱ひげ図
問2 相関係数とグラフ
問3 変化率
問4 ラスパイレス指数
問5 抽出法
問6 抽出法
問7 ベイズ法
問8 変数変換、正規分布
問9 二項分布、最大値
問10 標本平均
問11 歪度、尖度
問12 二項分布、正規近似、95%信頼区間
問13 t検定
問14 F検定、アルファエラー
問15 二項分布、正規近似
問16 適合度検定
問17 重回帰モデル
問18 重回帰モデル
◇2018年6月
問1 箱ひげ図
問2 散布図、変動係数、相関係数、単回帰モデル
問3 ローレンツ曲線、ジニ係数
問4 変化率
問5 フィッシャーの三原則
問6 抽出法
問7 確率計算
問8 正規分布、正規分布の差
問9 共分散、相関係数、変数変換
問10 標本平均、正規分布
問11 母比率の検定、二項分布、正規近似、二項分布の和
問12 分散の等しい2標本のt検定、分散分析
問13 アルファエラー、ベータエラー、検出力
問14 重回帰モデル
問15 クロス表の独立性検定
問16 等分散性の検定
続いて、勉強した内容について出題範囲表に沿って見ていきます。
「データの分布」「1変数データ」「2変数以上のデータ」は散布図、箱ひげ図、グラフなどの読み方や解釈の問題が結構入ってくるので過去問でも時々間違えました。何で学ぶといいのか難しいところですが、公式の教本(買ってないので分かりませんが、、、)や入門書、他には後で紹介しますが統計WEB(BellCurve)あたりが有用なのではないでしょうか。こちらのサイトは2級で出てくるような基本的な用語に関してはほぼ載っていると思います。
手前味噌ですが箱ひげ図・IQRに関しては自分のYouTubeチャンネルの動画も置いておきます笑
【解説】四分位範囲(IQR)の説明と箱ひげ図の見方|スキマで医療統計
続いて「データの活用」について。「単回帰と予測」は回帰分析について最低限の知識があれば細かい計算までは分からなくても良さそうです。おそらく目標としてはソフトなどで解析した際にきちんと結果を解釈できることだと思いますので、決定係数、回帰係数などの数値の意味が理解できれば十分だと思います。これは後ほどの重回帰についても同様です。
「時系列データの処理」についてはコレログラム、系列相関、トレンドなどは全く知らないのでこれも統計WEBでざっと見ました。さほど細かくは聞かれませんし、出ても1、2問なので用語を理解しておけば大丈夫そうです。
「推測のためのデータ収集法」は基本的な研究のデザインや流れを理解できていれば問題なさそうです。医学系であれば臨床論文の読み方を多少勉強していればその常識で問題ありませんが、標本の抽出方法についてはあまり使われないものもあるので別途覚えておいた方がよさそうです。系統抽出法、層化抽出法などなど。
「確率モデルの導入」「推測」は確率密度関数、分布関数と変数変換について色々応用を効かせた問いが多いです。また実例的な内容(「正規分布から抽出したと仮定して〜の平均を調べたら・・・でした。では95%信頼区間は?」など)もかなり多いので、基本的な内容をきちんと式に落とし込めるかも大事そうです。確率密度や分布、分散、期待値、共分散、相関係数、仮説検定などは定義式からきっちりと勉強しておくのが重要かと思います。分布としては二項分布、正規分布は超超重要なので、その性質や二項分布の正規近似などもきっちり学んでおきましょう。他にも幾何分布、一様分布、指数分布、ポアソン分布あたりはさらっと知っておいた方が良いかもしれません。超幾何分布や負の二項分布はあまり見ませんでしたが、、、。この辺は1級の勉強で統計数理を結構勉強していたので、特に何もしなくても問題ありませんでした。
「線形モデル」については上述の通り、最小二乗法などの実際の計算は問われませんが、結果の解釈がきちんとできるように偏回帰係数や回帰係数の検定の意味、やり方、特性などをきちんと学んでおく必要があります。過去問をいくつか解くだけでもある程度までは学べるように思います。
ただ、一元配置分散分析(ANOVA)についてはきちんと計算方法まで学ぶ必要があります。統計検定1級ではあまり出題されず、問題が選択式のため実は結構避けてきたのですが、これを機に勉強しました笑
基本的な内容で問われることが多いので、ANOVA tableと計算方法、F分布に従う検定統計量の作り方と検定のやり方まできちんと押さえておけば問題ありません。応用がしにくいのでむしろ押さえどころかもしれません。
実際本番までに統計数理と医薬応用分野で普段押さえきれていないところとして、「ローレンツ曲線」「ジニ係数」「トレンド」「ラスパイレス指数」「パーシェ指数」などの普段絶対使わない用語と「標本抽出法」あたりをサラサラ見直した感じとなりました。
必要な勉強量・勉強時間
今までのところだと、1級に向けて結局4年くらい統計の勉強をしています。仕事と家事・育児の間で早朝もしくは通勤中の勉強なので、平均すると朝30分程度を2−3日に1回くらいのペースでしょうか。昨年からは更にペースダウンして統計以外のことを結構やっているので、そこまで出来てません。
おそらく1−2年前の状態でも合格点(6割)を超えるくらいであれば達成できたと思うので、1日にそれほど時間が取れない人でも1-2年くらい頑張れば取れるのではないでしょうか。
一番時間がかかるのは「確率モデルの導入」と「推測」の部分を定義からきっちり学ぶところかなと思います。
役に立つ参考書・サイト
統計検定2級の受験において役に立った・役立つであろうサイトと参考書を見ていきます。
サイト
まずはこちら、「統計WEB/BellCurve」というサイト。
統計WEB - 統計学、調べる、学べる、BellCurve(ベルカーブ)
2級までに役立つ用語の解説や例題などが一つのページごとに簡潔にまとめられており、大変役に立ちます。一番最初に統計を勉強し始めた時もこのページをチラチラ眺めてました。図もあって見やすいので、重宝します。過去問を解きつつ知らない用語はここで調べるだけでも結構解ける問題は増えるのではないでしょうか。
続いてはこちら。
Hello! Statisticians! – あつまれ統計の森
こちらの「あつまれ統計の森」さんでは統計検定の過去問解説のほか、演習問題が結構あります。2級対策としては
「基本演習」あたりのところをきっちり抑えるのが大事かと思います。
2級については基本をしっかり抑えることが大事なので、個別のネット記事というよりかは参考書を見ながら過去問の出題内容をきっちり抑えれば良い気がします。
参考書
続いて、2級の勉強に使った参考書と今まで使った中で2級に役立ちそうな参考書を紹介します。
『日本統計学会公式認定 統計検定2級 公式問題集(2018~2021)』
公式の過去問です。計5回分の過去問と解答解説がついています。出題の傾向は概ね同じなので、まずはこれを買って傾向を掴みつつ、わからなかった内容を深めていくのが良いと思います。
公式の教本は読んでませんので内容はなんとも分かりませんが、2級から始めるのであれば買っておいても良い気はします。
(2023.2.23追記)新しくCBT対応版の過去問が出ていましたので、新しく買う方はこちらが良いかもしれません。
『入門統計学 -検定から多変量解析・実験計画法まで-』
2級の範囲であれば多くをカバーできる参考書です。確率分布、標本抽出、不偏推定、信頼区間、t分布、F分布に仮説検定、分散分析まで結構幅広く、かつ初学者向けに分かりやすく解説してくれており、例題もついているので、学習を深めることもできる素晴らしい一冊です。分散分析は水準間平方和と残差変動和の表が分かりやすく、混乱した時はいまだにこれを見直してます。おすすめです。ただ、単・重回帰モデルについてはカバーできません。
『マンガでわかる統計学 回帰分析編』
上記でカバーできない回帰分析について、導入に役立つのはこちら。マンガと言いながら結構ガチガチに計算を仕込んできますが、説明もわかりやすいので学び始めに役立ちます。
『マンガでわかる統計学』
上記と同作者の基本的な統計についての一冊。カイ二乗分布、F分布や仮説検定、独立性の検定などが学べます。『入門統計学』と内容は被るので、文章でわかるならそっちで良いかもしれません。
『例題で学ぶ初歩からの統計学』
確率分布の基本とZ検定、t検定、母平均母比率の検定について修練を積みたければこちらが簡便でおすすめです。統計検定2級に出そうな具体的な設定がされた問題が結構あるので腕試しにはぴったりです。問題数もそこまでは多くないので達成感もあるかと思います。
『明解演習 数理統計』
古い教科書ですがいまだに根強いファンのいる明解演習シリーズの一冊です。大学受験でおなじみのいわゆるチャート式と同じ方式で1ページが例題+練習問題で構成されており、それが単元ごとに整理されているような内容となっています。統計検定2級では高校数学の確率のような問題も時々出てきていますので、そうしたところも前半でカバーされているのと、後半は仮説検定、標本分布も取り扱っているので、幅広く実践的に対策ができます。
統計検定1級の対策ページには上記の参考書に加えて他にも多数紹介していますが、おそらく必要になるのはこの辺りくらいまでじゃないかと思っています。これでは物足りない方は1級対策のページもご覧ください。
統計検定1級の試験範囲と過去の記事・お役立ちサイト・参考書をまとめてみた【統計検定1級対策】 – 脳内ライブラリアン
当日の感想
上記のような対策の上、試験本番に挑みました。
CBT方式のため、自宅から近い試験会場に申し込みをし、出発。持参が必要なものは基本的には電卓と写真付きの身分証明書のみでした。ペンと計算用紙は会場で貸してもらうことができ、マジックとツルツルの計算用紙2枚分を借りて行いました。
電卓はプログラム電卓など計算機能があるものやスマートフォンは使えないので注意しましょう。以下、統計検定公式ページより引用です(2022.12.19現在)。
【持ち込み可能な電卓】
四則演算(+-×÷)や百分率(%)、平方根(√)の計算ができる普通電卓(一般電卓)または事務用電卓
【持ち込み不可の電卓】
上記の電卓を超える計算機能を持つ金融電卓や関数電卓、プログラム電卓、グラフ電卓、電卓機能を持つ携帯端末
私は1級受験の時に買ったこちらの電卓を使いました。
本番はパソコンで問題を見て、解答番号をぽちぽちクリックあるいはキーボードで打ち込みしていきます。公式ページの問題例を見ると分かりますが、右上に「あとで見直す」というチェックボックスがあります。解き終わった時に問題一覧画面が出て、チェックを打った問題がわかるようになっており、さっと戻ることができるわけです。親切ですね。
さて本番の問題ですが、最新の過去問はだいたい8割前後取れていましたし、時間も60-70分くらいで終わっていたので、それなりに余裕はあるのかなと思っていたわけですが、本番は結構きつかった(汗。
傾向の違いなのか、本番だからなのか分かりませんが、過去問を見ると問題設定一つにつき小問が2個くらいあったりするものが結構あったと思うのですが、本番はほとんどが問題設定一つにつき、1個しか問題がありませんでした。そうなると一問解くごとに新しい問題設定について考えねばならず、頭が結構疲弊します。時々詰まったりする問題があると(細かい統計よりもむしろ高校数学的な確率の問題で詰まった笑)時間も食ってしまうので、なんだかんだで時間一杯で見直す時間はあまりありませんでした。結果としては82点でした。とりあえず受かってよかったです。
1級もそうですけどやっぱり本番の方が難しい!という気持ちをもっていかないと心がやられますね。
統計検定2級は結構幅広く基本的な統計の内容をおさえられる良い試験だったと思うので、興味のある方はぜひ受験を目指してみてください。
コメントを残す