ビッグデータ分析・活用のためのSQLレシピ

書籍キャッチコピー
データ加工から売上・ユーザー把握、レポーティング等々の各種データ分析まで
著者名
加嵜長門、 田宮直人
出版社名
マイナビ出版
価格
4180
ページ数
496
出版年月日
2017/03/31


本書のポイント

  • データの種類についての解説や1つの値に対する操作など、SQLの基本を丁寧に学ぶことができ、SQLの入門書として活用することができる。
  • 複数のミドルウェアにおける構文パターンが掲載されているため、それぞれの長所や短所に触れながら学習を進めることができる。
  • 実践を想定した様々なマーケティングフレームワークをSQLで実装する所まで学ぶことができる。

レビュー

SQLをこれから学びたい、または基礎的な構文を学習したので初級者を脱したい、そういったデータ分析を学び始めて1年未満の読者にとって本書は適している。

1章から3章では1つ1つのデータ型に対する基礎的な操作から、Excelのピボットテーブルに近いグループ集計を学ぶことができる。Excelでデータの集計・分析を経験したことがある読者にとっては特にスムーズに理解できる構成になっている。

4章、5章では売上データを把握するためのデータ抽出としてZチャートの作成をはじめとしたデータ集約方法ついて丁寧に解説されている。アウトプットのイメージ図を使い丁寧に解説されているので多面的な軸での分析イメージを掴みやすい。特に5章ではマーケティングフレームワークであるRFM分析を実践することができる。ここでは単なるデータ集計から脱し購入日、購入回数、購入金額といった各軸で付けたランクを元にユーザーをグループ分けするプロセスを学べるが、このあたりから実務での活用イメージも湧き更にワクワクしながら読み進めることができる。

6章以降ではWebサイトの分析やログデータにおける異常値の検出など脱初学者と言えるトピックが解説されている。それらについては勿論学ぶ価値があるが、本書はこういったHowToに留まらず、最終章にてデータ分析全体のプロセスや分析を始める前に抑えるべき本質的な事柄を解説している。「提出したレポートを活用してもらうためには?」、「組織に何が不足してデータ活用が進んでいないのか?」というような俯瞰的な観点からの問いに答えることを通じて、本書を頭から学んで分析手法を網羅した気分になった初学者の目を覚ましてくれるだろう。(ライター自身の体験談)

最後に、本書は一度読み終えたとしても部屋の片隅に置いておく価値のある書籍である。本書のポイントでも書いたように、実用的なフレームワークの実装例が、様々なミドルウェア(PostgreSQL, Google BigQuery, SparkSQL, Apache Hive, Amazon Redshift)で掲載されているため辞書として活躍してくれるだろう。

目次

第1章 ビッグデータ時代に求められる分析力とは
第2章 本書で扱うツールとデータ群
第3章 データ加工のためのSQL
第4章 売上を把握するためのデータ抽出
第5章 ユーザーを把握するためのデータ抽出
第6章 Webサイトでの行動を把握するためのデータ抽出
第7章 データ活用の精度を高めるための分析術
第8章 データを武器にするための分析術
第9章 知識に留めずに行動を起こす

この書籍に興味がある人へのおすすめ


レビューワー

TAKATSUGI Shinya

関連記事

  1. Webサーバを作りながら学ぶ 基礎からのWebアプリケーション開発入門

  2. [エンジニアのための]データ分析基盤入門 データ活用を促進する! プラットフォーム&データ品質の考え方

  3. Pythonではじめる数理最適化 ケーススタディでモデリングのスキルを身につけよう

  4. Pythonで学ぶアルゴリズムの教科書 一生モノの知識と技術を身につける

  5. 化学のためのPythonによるデータ解析・機械学習入門

  6. マンガでわかる統計学 回帰分析編

  7. 効果検証入門〜正しい比較のための因果推論/計量経済学の基礎

  8. 基礎統計学Ⅰ 統計学入門

  9. Google Cloudではじめる実践データエンジニアリング入門 業務で使えるデータ基盤構築