前回は、「SMART」の考え方に従い、「観察可能な結果を記述できる」ものを考えてみました。今回は、ちょっと別の切り口から設定方法を検討してみたいと思います。
なお、「一般社団法人データサイエンティスト協会 スキルチェックリスト」を引用させていただきます。
「一般社団法人データサイエンティスト協会」が公表しているスキルチェックリストには、データサイエンティストに必要なスキルセットとそのスキルレベルが定義されています。このチェックリストと自分のスキルを比較することで自分がどのレベルにいるのかをチェックすることが可能です。
「一般社団法人データサイエンティスト協会 スキルチェックリスト」の内容を少しサマってみました。
No. | スキルレベル | ビジネス力 | データサイエンス力 | データエンジニアリング力 | |||
スキルレベル | 項目数 | スキルレベル | 項目数 | スキルレベル | 項目数 | ||
1 | Senior Data Scientist (業界を代表するレベル) |
★★★★ | ー | ★★★★ | ー | ★★★★ | ー |
2 | Full Data Scientist (棟梁レベル) |
★★★ (50%を満たしている) |
42 | ★★★ (50%を満たしている) |
64 | ★★★ (50%を満たしている) |
42 |
3 | Associate Data Scientist (独り立ちレベル) |
★★ (60%を満たしている) |
49 | ★★ (60%を満たしている) |
121 | ★★ (60%を満たしている) |
63 |
4 | Assistant Data Scientist (見習いレベル) |
★ (70%を満たしている) |
22 | ★ (70%を満たしている) |
86 | ★ (70%を満たしている) |
39 |
項目数合計 | 113 | 271 | 144 | ||||
サブカテゴリ | 項目数 | サブカテゴリ | 項目数 | サブカテゴリ | 項目数 | ||
行動規範 契約・権利保護 論理的思考 着想・デザイン 課題の定義 データ入手 項目数 ビジネス観点のデータ理解 分析評価 事業への実装 活動マネジメント |
15 9 16 7 17 3 6 3 3 7 30 |
基礎数学 予測 検定/判断 グルーピング 性質・関係性の把握 サンプリング データ加工 データ可視化 分析プロセス データの理解・検証 意味合いの抽出、洞察 機械学習技法 時系列分析 言語処理 画像・動画処理 音声/音楽処理 パターン発見 グラフィカルモデル シミュレーション/データ同化 最適化 |
24 23 7 12 15 5 38 4 23 4 39 9 16 10 6 7 5 4 4 9 |
環境構築 データ収集 データ構造 データ蓄積 データ加工 データ共有 プログラミング ITセキュリティ |
28 18 11 18 14 15 24 16 |
スキルレベルは4種類、スキル項目は合計で528項目あります。項目数が多いのに驚きましたが、目標設定には適しています。まずは、一番下のレベルの「見習いレベル」を目指します。
「一般社団法人データサイエンティスト協会 スキルチェックリスト」の見習いレベルのスキルレベルは以下のように整理されています。
スキルレベル | ビジネス力 | データサイエンス力 | データエンジニアリング力 |
Assistant Data Scientist (見習いレベル) |
・ビジネスにおける論理とデータの重要性を理解したデータプロフェッショナルとして行動規範と判断が身についている -データを取り扱う倫理と法令の理解 -引き受けたことは逃げずにやり切るコミットメント -迅速な報告や、報告に対する指摘のすみやかな理解 など ・データドリブンな分析的アプローチの基本が身についており、仮説や 既知の問題が与えられた中で、必要なデータを入手し、分析、取りまと めることができる -データや事象のダブリとモレの判断力 -分析前の目的、ゴール設定 -目的に即したデータ入手 -分析結果の意味合いの正しい言語化 -モニタリングの重要性理解 など ・担当する検討領域についての基本的な課題の枠組みを理解できる -担当する業界の主要な変数(KPI) -基本的なビジネスフレームワーク など |
・統計数理や線形代数、微分積分の基礎知識を有している (代表値、分散、標準偏差、正規分布、条件付き確率、母集団、相関、 ベイズの定理、ベクトルや行列の計算方法、関数の傾きと微分の関係 など) ・データ分析の基礎知識を有している -分析用データの整備 -予測、グルーピングなどのモデリング -モデルの評価 ・機械学習の基本的な概念を理解している -教師あり学習と教師なし学習の違い -機械学習における過学習の理解など ・適切な指示のもとに、データ加工を実施できる -基本統計量や分布の確認、および前処理(外れ値・異常値・欠損値の除去・変換や標準化など) ・データ可視化の基礎知識を有している -軸だし -不適切な表現の理解 -意味合いの導出 |
・データやデータベースに関する基礎知識を有している -構造化/非構造化データの判別、論理モデル作成 -ER図やテーブル定義書の理解 -SDKやAPIの概要理解など ・数十万件程度のデータ加工技術を有している -ソート、結合、集計、フィルタリングができる -設計書に基づき、プログラム実装できる ・適切な指示のもとに、以下を実施できる -データベースから条件を満たすデータを抽出できる -インポート、レコード挿入、エクスポート ・セキュリティの基礎知識を有している (機密性、可用性、完全性の3要素など) |
内容をみると、「基礎知識を有している」、「〜が身についている」、など定性的な表現となっていますので、先日検討した「資格」よりは曖昧になりますが、何ができればよいか、という指標に使うには有効かと思います。
上記は、まだ概要レベルでより詳細なチェックリストが存在します。ここでは記載しきれないため別記事で複数回に分けて書いていければと思います。
本日は、ここまでです。