本書のポイント
- データサイエンス領域の仕事の内容や働き方、心構えといったデータサイエンティストの全体像を把握できる。
- 要因解析から数値予測、予兆検知など幅広いデータ関連技術をPythonコードを書きながら体感できる。
- 分析結果や機械学習を実際の現場に適用するためのノウハウを学ぶことができる。
レビュー
本書は2020年に日立製作所で立ち上がったLamada Data Science Labsのメンバーの知見や叡智を凝縮した一冊となっている。現場のデータサイエンティストたちが書いた本であるため、実務的な内容となっており、これからデータサイエンティストになろうとしている人やデータサイエンスを業務で活用したい人には必読の一冊である。
本書の1つ目の特徴としては、データサイエンティストの全体像を把握できることである。本書では機械学習など技術的な内容だけでなく、そもそもデータサイエンス領域の仕事にはどのようなものがあるか、どのような働き方をしているか、どのような心構えが必要かも丁寧に解説をされている。そのためデータサイエンティストに興味を持った人が本書を読むことで、データサイエンティストの働き方のイメージができ、また幅広いデータサイエンス領域の中でどの領域が一番自分の強みが出せそうかを確認することができる。
本書の2つ目の特徴としては、要因解析から数値予測、予兆検知など幅広いデータ関連技術をPythonコードを書きながら体感できることである。この本では実際に日立製作所で実施した業務が元となっており、業務の中で使われた数値解析や数値予測、予兆管理、画像認識、テキスト分類、MLOpsなど様々なデータ関連技術を本書では取り上げている。そのため、本書を読みながらコードを書き、動かすことで主に業務で使われる機械学習などの実用的なライブラリーを網羅することが可能である。なお、サンプルコードはWebに公開されている(※書籍に記載のパスワードが必要)ため、コードを書かなくてもすぐ動かすことができる。
本書の3つ目の特徴としては、分析結果や機械学習を実際の現場に適用するためのノウハウを学ぶことができることが挙げられる。数多くあるデータ分析や機械学習の書籍では、方法論で終わることが多く、実際の現場でどのように活用するかまで書かれている書籍はあまりない。本書では、工場内での不良削減、在庫予測、コールセンターの問い合わせ自動化まで幅広い業務内容について書かれており、それぞれで分析結果や機械学習の活用方法ついて解説されている。そのため、機械学習を勉強しているが実務での活用方法がわからない人が読むことで、自分の仕事につながるヒントを見つけることができる。
ちなみに、本書はデータサイエンティストの実務現場で使われるデータ分析や機械学習にフォーカスして書かれているため、統計的手法や機械学習のアルゴリズム的なことを深く知りたいという人にはおすすめできない。
本書の1つ目の特徴としては、データサイエンティストの全体像を把握できることである。本書では機械学習など技術的な内容だけでなく、そもそもデータサイエンス領域の仕事にはどのようなものがあるか、どのような働き方をしているか、どのような心構えが必要かも丁寧に解説をされている。そのためデータサイエンティストに興味を持った人が本書を読むことで、データサイエンティストの働き方のイメージができ、また幅広いデータサイエンス領域の中でどの領域が一番自分の強みが出せそうかを確認することができる。
本書の2つ目の特徴としては、要因解析から数値予測、予兆検知など幅広いデータ関連技術をPythonコードを書きながら体感できることである。この本では実際に日立製作所で実施した業務が元となっており、業務の中で使われた数値解析や数値予測、予兆管理、画像認識、テキスト分類、MLOpsなど様々なデータ関連技術を本書では取り上げている。そのため、本書を読みながらコードを書き、動かすことで主に業務で使われる機械学習などの実用的なライブラリーを網羅することが可能である。なお、サンプルコードはWebに公開されている(※書籍に記載のパスワードが必要)ため、コードを書かなくてもすぐ動かすことができる。
本書の3つ目の特徴としては、分析結果や機械学習を実際の現場に適用するためのノウハウを学ぶことができることが挙げられる。数多くあるデータ分析や機械学習の書籍では、方法論で終わることが多く、実際の現場でどのように活用するかまで書かれている書籍はあまりない。本書では、工場内での不良削減、在庫予測、コールセンターの問い合わせ自動化まで幅広い業務内容について書かれており、それぞれで分析結果や機械学習の活用方法ついて解説されている。そのため、機械学習を勉強しているが実務での活用方法がわからない人が読むことで、自分の仕事につながるヒントを見つけることができる。
ちなみに、本書はデータサイエンティストの実務現場で使われるデータ分析や機械学習にフォーカスして書かれているため、統計的手法や機械学習のアルゴリズム的なことを深く知りたいという人にはおすすめできない。
目次
第1章 データサイエンスの現場
1.1 ビジネスの現場で活躍するデータサイエンティストとは?
1.2 十人十色のデータサイエンティスト
1.3 データサイエンティストの一日
1.4 データサイエンスプロジェクトを成功させるには?
第2章 データサイエンティストになるには
2.1 高度な統計、数学知識が必要?
2.2 データサイエンティストが扱う代表的なツール
2.3 データサイエンティストとしての心構え
第3章 データサイエンスプロジェクトの進め方 ~失敗しないためには~
3.1 データサイエンスプロジェクトの流れ
3.2 1業務課題の把握(プロジェクト起案)
3.3 2分析方針の設計
3.4 3データの理解・収集
3.5 4データの加工
3.6 5データ分析・モデリング
3.7 6分析結果の考察
3.8 7業務への適用
第4章 分野別に学ぶデータサイエンス
4.1 はじめに
4.2 数値解析(予測)
4.3 数値解析(予兆検知)
4.4 数値解析(要因解析)
4.5 画像認識(適用技術: Deep Learning)
4.6 テキスト解析(文書分類)
4.7 数理最適化(生産計画最適化)
第5章 データサイエンスの現場適用とは
5.1 分析結果を現場で活用するには
5.2 分析モデルの寿命!?
5.3 MLOpsという考え方
5.4 MLOpsを動かしてみよう
第6章 データサイエンティストの未来
6.1 データサイエンティストが不要になる時代が来る!?
6.2 データサイエンティストとして今後重要になるポイント
6.3 学び続けることの大切さ・楽しさ
1.1 ビジネスの現場で活躍するデータサイエンティストとは?
1.2 十人十色のデータサイエンティスト
1.3 データサイエンティストの一日
1.4 データサイエンスプロジェクトを成功させるには?
第2章 データサイエンティストになるには
2.1 高度な統計、数学知識が必要?
2.2 データサイエンティストが扱う代表的なツール
2.3 データサイエンティストとしての心構え
第3章 データサイエンスプロジェクトの進め方 ~失敗しないためには~
3.1 データサイエンスプロジェクトの流れ
3.2 1業務課題の把握(プロジェクト起案)
3.3 2分析方針の設計
3.4 3データの理解・収集
3.5 4データの加工
3.6 5データ分析・モデリング
3.7 6分析結果の考察
3.8 7業務への適用
第4章 分野別に学ぶデータサイエンス
4.1 はじめに
4.2 数値解析(予測)
4.3 数値解析(予兆検知)
4.4 数値解析(要因解析)
4.5 画像認識(適用技術: Deep Learning)
4.6 テキスト解析(文書分類)
4.7 数理最適化(生産計画最適化)
第5章 データサイエンスの現場適用とは
5.1 分析結果を現場で活用するには
5.2 分析モデルの寿命!?
5.3 MLOpsという考え方
5.4 MLOpsを動かしてみよう
第6章 データサイエンティストの未来
6.1 データサイエンティストが不要になる時代が来る!?
6.2 データサイエンティストとして今後重要になるポイント
6.3 学び続けることの大切さ・楽しさ
この書籍に興味がある人へのおすすめ
レビューワー
Yu Ohta