MLOps Engineering at Scale
作者: Carl Osipov
语言: 英文
出版年份: 2022
下载链接:
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。

书籍摘要

核心定位

《MLOps Engineering at Scale》是一本面向生产化机器学习的工程实践书,作者 Carl Osipov 将重点放在实验性 ML 代码与可运行、可扩展、可维护系统之间的落差。它不是算法研究教材,也不是从零讲机器学习的入门书,而是以 serverless machine learning 为主线,说明如何借助 AWS 等公有云能力,把结构化数据上的监督学习项目推进到可部署的机器学习平台。

内容主线

全书围绕一个 Washington, DC taxi fare 预测项目展开:先理解业务与数据,再建立云端数据集处理能力,随后用 PyTorch 构建模型并扩展训练,最后把特征工程、超参数优化、容器化和流水线组装起来。作者反复强调,生产 ML 系统中模型代码只是一小部分,数据采集、存储、质量验证、训练、部署和维护才是工程难点。

章节内容

第一章界定机器学习平台与 serverless ML,解释为何云服务、弹性伸缩和按量计费能降低 MLOps 的基础设施负担。

第二章~第四章以 DC 出租车数据为案例,覆盖对象存储、AWS Glue、Athena、数据质量治理、VACUUM 清洗、抽样以及训练/测试/验证集准备。

第五章~第八章进入 PyTorch,先讲 tensor、autograd、optimizer、Dataset 与 DataLoader,再讨论大数据集、GPU 加速、梯度累积和 ring-based 分布式训练。

第九章~第十二章聚焦完整流水线:特征选择,PyTorch Lightning,Optuna 超参数优化,MLflow 支持,Kaen、Docker 与 AWS provider 下的训练流程。

适用读者

本书适合已有 Python、SQL、基础机器学习经验,并希望把原型模型交付到生产环境的 ML engineer、data scientist、software engineer 或 data engineer。完全零基础读者会吃力;只想学习新算法或理论推导的读者也不适合。若你关注云端结构化数据项目、AWS 实作、可复现实验与工程化部署,它的案例价值较高。

总评

这本书的优势在于把 MLOps 拆成可操作的工程路径,而不是停留在概念层面。它用单一项目贯穿数据、模型、训练规模化和流水线,能帮助读者理解“把模型做出来”和“让模型系统可用”之间的真实差距。局限是技术栈明显偏 AWS、PyTorch 与书中示例工具,读者需要自行判断迁移成本。总体而言,它更像一份生产 ML 项目的云端工程路线图。

期待您的支持
捐助本站