こんにちは!
1級FP技能士のアシまるくんです!
第1章『そもそも統計検定とは?』
いきなりクイズ(*1)です!
ここ数年で、書店の数学書コーナーをある本が席巻しだしました。
それはなんでしょう?
まあ、タイトルでネタバレしてしまっているので、そそくさと正解発表に移ります。
統計検定の対策テキスト・問題集ですね。
世界は大量の情報に溢れ、データを制すものがビジネスを制すとでも言わんばかりに、よりよい意思決定をするというお題目で統計学への注目が高まっています。(*2)
受検者数も2011年の試験創設時から順調に増え始め、特に2020年代に突入してからは受験者累積数がわずか5年で約2倍となり、現在は累積17万人以上が受験しています。
そんな時流を私はどう感じていたかというと、"確率解析で大学院を修了しているから、統計検定なんぞ取得しなくともスキルは十分証明できるっしょ"です。
まあ、合理的ではありますが、慢心はちょっと見え透いていますね笑
ところが、今年の初めに地元の友人から1通のLINEが届きました。
"統計検定2級を受検しようと思ってるだけど、おススメの勉強法教えてくれない?"
前述の通り、統計検定への関心がないわけではなかったので、一般的に良いとされている教材を伝えましたが、私の性格上、自分が受かってもない試験の学習法を指南するというのは信条に反します。
加えて、たまたま統計検定2級の問題集を無償でお借りできる機会に恵まれました。
最後にこれが決め手ですが、統計検定には表彰制度というのがあります。2級の場合は、おそらく90点以上で合格した場合、最優秀賞が与えられます。
"統計検定2級で最優秀賞を獲った!"、これは話のネタになります。
3つの追い風が吹いたことで、じゃあ受検するか、と受検が決まったわけです。
(*1)いきなりステーキ、一時期ほど見なくなりましたね。小耳に挟んだ話だと、出店を焦るあまりマーケティングがおろそかになったとか。マーケティングは機械学習の応用分野としても有名なので、他人事ではないですね。
(*2)これが人類としていい傾向かどうかは、私には分かりませんが、どんな形であれ多くの方が数学に興味を持つきっかけが増えたのはシンプルに嬉しいですね。
第2章『世の中には優秀賞で悔やむ人間もいる』
結論から申し上げますと、86点/100点で優秀賞を受賞しました。どうやら85点以上で優秀賞がいただけるようです。最低限の威厳は保つことはできましたが、当初の目標であった90点以上で最優秀賞という目標は逃したことになります。
では、なぜ90点以上を逃したのか?
私は、"統計検定2級という試験にコミットしきれなかった"という点を挙げます。
アウトプットとインプットに分解し、それぞれにおけるコミット不足について見ていきましょう。まずは、アウトプットについて。
今回、1回も模試らしい模試を受けずに臨みました。
これについては、模試やそれに類する教材を見つけられなかったので、やむを得なかった部分もあります。公式問題集にある最後の総合問題も本番の出題量の半分くらいしか問題量がなかったので、なかなか難しいですね。
そして、受けるちょうどいいタイミングがなかったこともあり、推しのライブ(開演14:00)に行く直前に統計検定2級(12:00~13:30)というトンチキなスケジュール(*3)で受験を決行しました。これ、どういうことかと言うと、"90分も使い切ることはないだろう"という気持ちに加え、極めてリラックスした状態で受験したということですね。
リラックスした状態というものは試験において、意識すべき状態である一方、適度な緊張感はパフォーマンスを向上させます。要は、リラックスし過ぎていても緊張しすぎていてもよくないよ、という話です。
そんな私を裏切るかのように、試験本番は時間が本当に足りなくて、90分を使い切ってしまいました。本番を想定したトレーニング不足が如実に響いた形になります。
(*3)なおライブには、会場が非常に近かったこともあり、開演5分前に全く問題なく間に合いました。
第3章『郷に行っては郷に従え』
では、インプットでの敗因へHERE WE GO!
まず、確率パートはさすがにほぼ勉強せずとも何も問題がありませんでした。
しかし、統計パート。ジニ係数やコレログラム等、確率ではあまり馴染みのない概念がいくつかある。とはいえ、これは覚えてオシマイ。そんな苦労する箇所でもありません。
重点的に学習した個所は、尖度と歪度、適合度検定・独立性検定、分散分析、回帰分析の検定です。独立性検定まで一度学んだが、時間が経ちすぎて記憶から欠落した系。分散分析は初めて扱いました。
歪度と尖度、これが昔から何度か聞いているが、いちいち覚えにくいうえにピンとこない。どっちが3次モーメントでどっちが4次モーメントやねんと。歪度はまだいい、確かに正規分布と比較してどちらかに偏っていることを歪みと表現する、これは分かる。
問題は尖度。まず同じ正規分布を比べた場合、分散が小さいほうが明らかに平均付近が尖るので尖度が高いんだろうと思って、式を眺めてみると標準化しているのでそういうわけではない。分布に対して一つに決まるようだ。
尖り具合ではなく、裾の重さを測ると捉えた方がいいらしい。一様分布は裾がスパッと消えるので尖度が低く、t分布は小標本でやむなく正規分布になりそこなったものなので、同確率の推定範囲が広いため裾が重く尖度が高い。そして、標本が増えるほど正規分布に収束し尖度はどんどん低くなる。
しかし、グラフを並べてみると人間の目にはどう見てもt分布より正規分布のグラフの方がなだらか(*4)、つまり尖っていない。なんでやねん!
あと、尖度の英名は”Kurtosis"。これはもしかしてシャー芯がときんときんのまま使えるシャーペン(*5)のクルトガと語源が同じではないか?
と、脱線に次ぐ、脱線を繰り返す。
その後も、独立性検定、適合度検定がなぜカイ2乗の片側検定で行えるのか、分散分析がうまくいく理由、分散分析と回帰の検定が同一視できる理由など、気になることが多すぎて、自分の興味のままにより高度な参考書などを参照していきました。途中から試験範囲を完全に逸脱していったので、試験での高得点獲得という目的としては、だいぶイマイチな学習方法だったという次第です。
最後に、書籍紹介をして終わります。
蓑谷先生の"線形回帰分析"です。回帰の検定のところで疑問に感じていたところがとてもスッキリ理解できた本でした。数学書にしては珍しく、証明がとても丁寧で初学者・忙しい方向けに感じました。本の感想はまたどこかでじっくり書こうと思いますが、回帰分析はAIを学ぶ上においても避けては通れないと思いますので、既存の教材にご不満をお感じの方は一度お手に取ってみてはいかがでしょうか?
(*4)t分布が正規分布に近づいていく様は以下のサイトが見やすいです。自由度が増えるにつれ、中心が尖っていくさまが見て取れます。なのに、尖度は下がっていく。なんでやねん!
(*5)"ときんときん"は先端がとがっているさまを形容する名古屋弁。なお、シャーペンの英語名はメカニカルペンシルというのはあまりにも有名な雑学。



