2021年から情報として知ってはいて、
ずっと気になっていたものの、
なかなか時間も取れず、見送っていた資格がありました。
『データサイエンティスト検定 (リテラシーレベル)』という資格です。
シンニホンで有名な安宅和人さんも理事として役員に名を連ねている、
『一般社団法人 データサイエンティスト協会』が開催している試験です。
年に2回試験があり、
次回が2022年11月頃ということでタイミングもいいということで勉強を開始し、
先ほど試験申込みしたのでした。
データサイエンティスト検定の概要
『データサイエンティスト検定』はまだ歴史が浅く、2021年春からスタートしている試験です。
『データサイエンティスト検定』は大きく3つの領域に分かれています。
- データサイエンス
- データエンジニアリング
- ビジネス
他の資格と比べて「ビジネス」が加わっているのが珍しいのですが、
現実世界でデータサイエンスを使うとなるとどうしてもビジネス現場が絡んでくるので、
とても現実的、実践的な試験を目指してるのだなと思いつつ、試験範囲を確認してみることにしました。
データサイエンティストの試験範囲
公式リファレンスブックと問題集があったので早速購入。
2022年4月発行の問題集を元に、ざっと試験範囲を見た実感をまとめてみました。
試験範囲その1 データサイエンス力
試験範囲は大きく2つあります。
- 数理統計
- 機械学習
数理統計の方は、微分、積分、内積、行列、統計学(基本)、グラフの見せ方 などなど。
浅く広くという印象ではありますが、
統計学の知識が全然足りてないなと感じたため、別途『統計学』の本も購入して知識補充しています。
一部計算が必要で、試験画面上に電卓も表示されるようで、多少なり公式を覚えておく必要があります。
機械学習の方は、
最小二乗法や重回帰分析、AUC、交差検証法、機械学習の種類(SVM、k-mean)、カテゴライズ、CNN、表の種類
などなど。
こちらは実際の計算はなさそうですが、専門用語だらけなのでしっかり理解・把握しておく必要があります。
試験範囲その2 データエンジニアリング力
データエンジニアリングに関しては大きく2つ。
- 知識
- SQL
知識というのは簡単な通信プロトコル、セキュリティ、スクレイピング、データベースなど。
データサイエンスということでSQLや正規化、分散化、NoSQLなどの知識も含まれますが、
こちらも広く浅くということで、
SQLガリガリやっている身としては難易度は高くない印象です。
試験範囲その3 ビジネス力
ビジネス力も大きく2つに分かれています。
- プロジェクト推進
- 法律・倫理
社会人経験があり、プロジェクトを進めた事があればこちらも難易度は高くないのですが、
法律に関しては知らない用語もあり、油断せずに把握しておく必要があります。
試験範囲その4 モデルカリキュラム
ここ数年のデータサイエンスを取り巻く環境や知識を広く浅く出題されるようで、
『教養としてのデータサイエンス』を購入して流し読み。
大枠は知っていたものの、細かい用語など怪しい箇所もあったので、
ノートにメモしつつ何度か復習する予定です。
データサイエンティスト協会を受験するにあたって
試験範囲が広く、特に統計学と機械学習はまだまだ知識が足りないため、
一通り全体を確認した後は、統計学、機械学習に時間を割いて知識補充しつつ、
Python使って色々と試しながら身につけていく必要があるなと感じています。
『東京通信大学』へ入学する事も決まり、
これからは『Web系』の知識・情報発信に加えて、
『データサイエンス』にも本腰を入れて情報発信していきます。
引き続きよろしくお願いいたします。
追記:無事合格しました。
この記事へのコメントはありません。