本記事では、実際に統計検定準1級を2回受験してようやく合格に辿り着いた、現役データサイエンティストが、合格後に時間をかけて出題傾向と学習方法や試験に対する戦略を再構築したものになります。要するに、「もう1回合格しにいくなら、こうやる!」を記載しています。ぜひ最後までご覧ください。
時間のない方向けに、以下本記事のまとめです。
- 各分野での出題傾向・頻度の差は間違いなくある
- 「数理統計」「応用統計」や「重回帰分析」などの一連の繋がりなどを意識して、一通り学習した後に、ざっくり分けてみる
- それらを考慮した上で、優先順位をつける
- その優先順位は、表やグラフを参照してみてください!
出題傾向
まず始めに、以下の過去問を参照して集計した集計した表をご覧ください。こちらを見てどのように対策を練っていくかは皆さん次第ですが、私からも1例を紹介させていただきます。
上記の結果は、出題内容のまとめです。左側が章名と右側がその可視化です。6年分の出題を通して最も出題されているのは(大問ベース)6章の「連続型分布と標本分布」、10章「検定の基礎と検出法の導出」、16章「重回帰分析」と続いています。
またその割合を見ていくと、だいたい上位から主成分分析くらいまでで出題の半分を占めています。
さらに、6年間の推移を見てみると、毎年出題されているのは16章「重回帰分析」、5年出題されているのが、6章「連続型分布と標本分布」、27章「時系列解析」。4年出題されているのが、10章「検定の基礎と検定法の導出」、1章「事象と確率」、22章「主成分分析」、5章「離散型分布」という形で出てきました。
これらを踏まえ、どのように対策されるかは皆さん次第ですが、「合格がゴール」の方には、確かな手がかりになるかなと思います。
※集計はあくまで筆者によるもので、必ずしも正確ではありません。謝りを見つけましたらお知らせいただけますと幸いです。
分野の考え方
それでは各分野での考え方をご紹介いたします。
注意事項として、先程の出題数の比較などで、30章「モデル選択」や9章「区間推定」が下位に位置していますが、これらは必ずしも無視は出来ません。集計にこそ入れませんでしたが、出題自体はされます。例えば「重回帰分析の最も良いモデルはどれか?」などの問題も重回帰分析の問題として集計しております。
これらを踏まえ、いわゆる「数理統計」「応用統計」でまず分けて考え、「事象と確率」や「ベイズ法」なども切り分けて考えます。
「数理統計」では2章〜6章あたりまでは、かなり踏ん張る必要があります。はっきり言って数式などに慣れていないと難しいです。私もそうでした。なんなら一旦飛ばして先に進んでも良いかと思います。それ以降の推定や検定は頻出です。2級の分野・問題とも重複する部分もあるので比較的とっつきやすい分野かとも思います。
ここら辺を越えてくると、「応用統計」が顔を出してきます。まず14章「マルコフ連鎖」。これは分からなければ飛ばしても大丈夫です。大事な分野ではありますが、そのほかの分野と有機的に繋がったりはしないので、最悪やらなくても致命傷には至らないと思います。
16章「重回帰分析」は16〜19章・30章「モデル選択」と一連の流れで考えると良いと思います。大変ではありますが、1章分終わっても息継ぎせずに、上記の流れで一気通貫でやると良いと思います。
以降の「応用統計」では、それぞれ独立しているものの、検定や推定に関する問題は出題されます。優先順位をつけて、その分野と推定・検定の復習をしつつ、さらに理解をしていくと良い戦略になると思います。
まとめ
- 各分野での出題傾向・頻度の差は間違いなくある
- 「数理統計」「応用統計」や「重回帰分析」などの一連の繋がりなどを意識して、一通り学習した後に、ざっくり分けてみる
- それらを考慮した上で、優先順位をつける
- その優先順位は、表やグラフを参照してみてください!
以上です。ぜひ皆さんも統計検定準1級にチャレンジしてみて、合格を掻っ攫ってみてください!
付録
2回受験した私が、絶対仕込んでいおた方が良い問題をお教えします。あくまで私のセンサーに引っかかっただけなので、ご参考まで。
- 【ワークブック】問1.1
- 【ワークブック】問5.4
- 【ワークブック】問10.2
- 【ワークブック】問29.1
- 【過去問】19年問1
- 【過去問】19年問2
- 【過去問】15年問1
ここら辺です。ただ個人的なセンサーに引っかかっただけなので、あまり気にしないでください。
コメント