SQL for Data Analysis

作者：	Cathy Tanimura
语言：	英文
出版年份：	2021
编程语言：	SQL
下载链接：	PDF 城通网盘 EPUB 城通网盘书籍均收集自互联网，仅供学习和研究使用，请莫用于商业用途。谢谢合作。

书籍摘要

核心定位

这本书是一部面向数据分析师、分析工程师与数据科学从业者的进阶 SQL 实战书，重点不是教你从零记住 SELECT 语法，而是教你如何用 SQL 处理真实分析任务：数据准备、时间序列、留存与 cohort、文本处理、异常检测、实验分析，以及为后续分析构建复杂数据集。它更像一本“分析问题怎样落到 SQL 上”的方法书。

内容主线

全书沿着“先建立分析视角，再进入典型分析场景，最后回到复杂工程组织”的路线展开。前两章先解释为什么 SQL 仍然是分析工作的核心工具，以及分析前的数据整理、质量检查和结构重塑。中间几章分别覆盖时间序列、cohort、文本、异常检测和实验分析，把不同业务问题拆成可执行的 SQL 技法。最后一章再回到复杂数据集构建与综合分析，帮助读者把零散技巧组合成长期可维护的分析工作流。

章节内容

第一章说明数据分析工作的基本范式，以及 SQL 相比 Python、R 和 BI 工具的优势、边界与适用位置，帮助读者建立“SQL 在分析流程中扮演什么角色”的整体认知。

第二章聚焦分析前的数据准备，包括数据类型、查询结构、分布与质量剖析、去重、清洗、空值处理，以及面向 BI、可视化、统计与机器学习的 reshape 思路，是全书的方法基础。

第三章到第七章进入典型分析专题：时间序列分析、cohort 与留存分析、文本分析、异常检测、实验分析。每章都围绕一种常见业务分析场景，展示如何把问题拆成 SQL 查询、窗口函数、聚合、正则、比较分析等具体操作。

第八章讨论如何组织更复杂、可复用的 SQL 代码与分析数据集，包括子查询、临时表、CTE、代码组织、ETL 边界、数据规模控制与隐私问题。

第九章作为收束，补充 funnel、churn、basket analysis 等综合型分析问题，并给出进一步学习资源，把前面各章的方法重新串联起来。

适用读者

适合已经掌握基础 SQL、正在承担真实分析任务的人阅读，尤其是数据分析师、产品分析师、商业分析师、分析工程师，以及需要直接和数据库打交道的数据科学从业者。它不太适合完全零基础读者；如果你还不熟悉基本查询、聚合、连接和分组，阅读时会明显吃力。

总评

《SQL for Data Analysis》最大的价值，在于它把 SQL 从“查询语言”提升为“分析工作语言”来讲。书里不是孤立地堆函数，而是围绕真实分析任务组织技巧，强调方法、判断与落地场景。对于希望把 SQL 用得更像分析工具而不是报表脚本的人，这本书很有参考价值。