はじめに
この記事を読まれている方は、おそらく「未経験」もしくは「駆け出し」のデータサイエンティストの方、またはデータサイエンティストになりたい・転職したいような方でしょう。
そのほか、現役のデータサイエンティストの方で、「コイツの言う5選を見定めてやろう」と考えている方ではないでしょうか。
いずれの方もご訪問ありがとうございます。
我々データサイエンティストとは、非常に曖昧な職種です。そんなデータサイエンティストですが、定義を決めようぜという団体、「データサイエンティスト協会」は、データサイエンティストを構成する3つのスキルを定義しています。それは「データサイエンス力」「データエンジニアリング力」「ビジネス力」です。
世間一般的に思われている「データサイエンティスト」とは、これらの能力が非常に高く、様々な課題を高度な機械学習やAIを用いて解決に導くを思われています。しかし、実際はそうではありません。
データサイエンティスト協会は、上記の3つの能力が高いことを必須条件としていません。むしろ全てハイエンドに3つのスキルを備えている人は世界でもごく少数です。
これら3つのスキルの組み合わせや自分なりに高める方向性を持つことが重要だそうです。すなわち「このスキルなら勝負できる」という自らの方向性を持ち、そのほか最低限以上のスキルを持ち合わせることが重要なのです。
そんな世界で歩み始めて数年が経過した私、駆け出しのデータサイエンティストが、実際に役にたった書籍5選を紹介させていただきます。
ぜひ最後までご覧になってください。
全体を捉えるならここから!
AI・データ分析プロジェクトのすべて[ビジネス力×技術力=価値創出] [ 大城 信晃 ]
AI・データ分析プロジェクトのすべて/技術評論社
本書はデータサイエンティストの主な業務範囲である、「データ分析」や「AIプロジェクト」とは何か、全てが記載されております。
本書の特徴は、どのレイヤーを対象としているかということが明記されています。まだ社会に出ていない「学生」、駆け出しの「ジュニア」、経験のある「シニア」、この3つのレイヤーに対して明記しています。
また、本書の範囲も広く、それぞれプロジェクトの「準備」「入口」「実行」「出口」という構成になっていて非常に理解しやすいです。
駆け出しだと、まだまだプロジェクトの進撃の一部を担うのみだと思いますが、本書を通して一般的なプロジェクトの全体像を掴むことができます。もし違いがあるとすれば、それもまた一つ学びとなります。
おすすめの一冊です!!
統計学の金字塔!まずはこの1冊を理解しよう!
統計学入門 (基礎統計学) [ 東京大学 ]
統計学入門/東京大学出版会
本書は統計学の入門書として最も有名なものになります。
とはいえ、中身は意外と難しいです。数式などに慣れていない方は、まず他の統計学の入門書をよんでか、統計学の入門で必要な考え方などを理解した上で、本書を読むことをおすすめします。
本書のレベル感としては、高校数学がなんとなく理解できているレベルが必要な印象です。最も出てくるのはΣで、数列の和を表す記号です。これも怪しいようなら本書の前に別の入門書を読む必要があります。
とはいえ私もまだまだ、本書を参考に勉強していたり、完全に全ての内容を説明できるだけの深い理解には達していません。(悪しからず…)
そう言った意味でも、本書は入門書でありながら、長く参考になる書籍です。
手元に置いておいて損のない一冊です!
【関連書籍】
分析とは何か、本書から学ぼう
イシューからはじめよ 知的生産の「シンプルな本質」 [ 安宅和人 ]
イシューからはじめよ/英治出版
データサイエンティスト協会のスキル定義委員委員長の安宅和人さんによるビジネス書の名著です。
本書のジャンルとしてビジネス書なのですが、具体的なグラフの軸選びなど、分析業務的な観点で非常に参考になります。
特に駆け出しデータサイエンティストということであれば、データの可視化などを任されることも多いでしょう。そう言った時に本書は非常に役に立つと思います。
また、安宅さん自信が、「分析とは何か」について語ってくれています。
本書の主題である「イシューからはじめよ」について理解するとともに、「分析とは何か」についても安宅さんのいうところを理解し、自分なりに解釈して、腹落ちさせる。これが重要だと思います。
私も何度も読み返し、繰り返し本文をハイライトしたりして、絶えず吸収するようにしています。
駆け出しデータサイエンティストには、ぜひとは言わず、絶対に読んで欲しい一冊です!!
正しく見せる。正しく理解する。
FACTFULNESS(ファクトフルネス) 10の思い込みを乗り越え、データを基に世界を正しく見る習慣 [ ハンス・ロスリング ]
ファクトフルネス/日経BP
本書「ファクトフルネス」はビジネス書大賞2020を受賞した、ビジネス書で、多くの方々に読まれている書籍です。
本書は、思い込みや見せ方に惑わされないず、真実を自分で判断できるようになりましょうというのが簡単な内容です。
本記事の対象者である、駆け出しデータサインティストの皆さんにとっても非常に重要な話題です。「イシューからはじめよ」の章でも記載したとおり、駆け出しのデータサイエンティストは可視化の業務を行うことが多数です。
その業務の中で、意図しない伝わり方がされないように本書からの学びを得ることが重要だと私は思いました。また、よく見せようと変な工夫をしてしまうことも防げるでしょう。
正しいデータの読み取り方、そして伝え方を学ぶことができます。
ぜひ本書を読んでみてください!
さらに飛躍するために
[第3版]Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (top gear) [ Sebastian Raschka;Vahid Mirjalili ]
Python 機械学習プログラミング/株式会社インプレス
最後にご紹介させていただくのは、「Python機械学習プログラミング」です!
本書は、私の所属する会社のハイエンドデータサイエンティストの役員が、「この本をしっかり理解できれば中級のデータサイエンティストだよ」と言っていました。
いち早く駆け出し・初級を脱するために、すぐさまポチって中をざっと読んでみました。
これが結構ムズカシイ。
なかなか実務で参照する機会もなく、深い理解に私自身至っていません。
ですが、このブログの運営を通してアウトプットしていく中でしっかりと勉強できてばいいなと思っています。
人に勧めている割に、自分が本書の良さを完全に理解している訳ではありませんが、尊敬しているデータサイエンティストの貴重な指南書をぜひみなさんにも共有できればと思い、今回紹介させていただきました!
おうちに一冊、辞書がわりに置いておいてもいいかもしれません!ぜひ、どうぞ!
まとめ
AI・データ分析プロジェクトのすべて[ビジネス力×技術力=価値創出] [ 大城 信晃 ]
イシューからはじめよ 知的生産の「シンプルな本質」 [ 安宅和人 ]
FACTFULNESS(ファクトフルネス) 10の思い込みを乗り越え、データを基に世界を正しく見る習慣 [ ハンス・ロスリング ]
[第3版]Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (top gear) [ Sebastian Raschka;Vahid Mirjalili ]
以上の5冊になります。
いかがだったでしょうか。すでに皆さん読まれていましたか?それともまだ目を通せていない書籍でしたか?
いずれにしても私の経験上、読んできた他の書籍よりも役に立った書籍ですので、ぜひ皆さんも読んでみて学びとしていってください。
コメント