Automated Machine Learning in Action
书籍定位
Automated Machine Learning in Action 是自动化机器学习领域的实战指南,由 Qingquan Song 撰写。本书系统讲解 AutoML 的技术原理、工具框架和实践方法,帮助数据科学家和机器学习工程师利用自动化工具提升模型开发效率,降低机器学习项目的技术门槛。内容涵盖从数据预处理到模型部署的完整 AutoML 流程,是掌握现代机器学习自动化技术的重要参考。
核心内容
全书分为三大部分,系统覆盖 AutoML 的核心组件和实践应用:
第一部分:AutoML 基础与概念
- 机器学习项目面临的挑战:技术门槛高、人力成本大、专家稀缺
- AutoML 的定义与范畴:自动化机器学习全流程,包括数据准备、特征工程、模型选择、超参数调优
- AutoML 的三核心组件:自动化特征工程、自动化模型选择、自动化超参数优化
- 自动化程度探讨:从辅助工具到完全自动化,不同场景下的自动化策略
- AutoML 技术发展历史:从专家系统到贝叶斯优化,从遗传算法到神经架构搜索
- 机器学习项目端到端流程:问题定义、数据收集、预处理、特征工程、模型训练、评估、部署
第二部分:核心 AutoML 技术
- 自动化数据预处理:缺失值处理、异常值检测、数据标准化、类别编码自动化
- 自动化特征工程:特征生成、特征选择、特征变换、基于树模型的特征重要性评估
- 自动化特征学习:深度学习特征提取、自动编码器、特征嵌入学习
- 自动化模型选择:多算法比较、集成学习自动构建、Stacking 与 Blending 自动化
- 超参数优化方法:网格搜索、随机搜索、贝叶斯优化(SMAC、TPE)、进化算法
- 神经架构搜索(NAS):搜索空间设计、搜索策略(强化学习、进化算法、可微搜索)、性能评估策略
- 元学习(Meta-Learning):学习如何学习,基于历史经验的快速适应
- 迁移学习自动化:预训练模型选择、领域适配、微调策略自动化
第三部分:AutoML 工具与实战
- 开源 AutoML 框架:Auto-sklearn、Auto-WEKA、H2O AutoML、TPOT 详解
- 商业化 AutoML 平台:Google AutoML、Azure AutoML、Amazon SageMaker AutoPilot
- 深度学习 AutoML 工具:AutoKeras、NNI(Neural Network Intelligence)、Ray Tune
- 端到端 AutoML 项目实践:从原始数据到生产部署的完整案例
- 模型可解释性与 AutoML:自动化模型解释、特征重要性可视化、SHAP 值自动计算
- 自动化模型部署与监控:模型服务化、性能监控、漂移检测、自动重训练
- 多模态 AutoML:文本、图像、时间序列数据的自动化处理
- AutoML 系统架构设计:可扩展、可复用的 AutoML 平台构建
第四部分:高级主题与前沿
- 自动化强化学习:AutoRL 技术、策略搜索自动化
- 自动化时间序列预测:时间特征工程、序列模型选择、预测区间自动化
- 自动化异常检测:无监督异常检测算法选择、阈值自动化确定
- 自动化推荐系统:协同过滤、内容推荐、混合推荐的自动化构建
- AutoML 与 MLOps 集成:CI/CD for ML、自动化流水线、模型版本管理
- 边缘计算 AutoML:模型压缩自动化、设备端部署优化
- 联邦学习自动化:分布式模型训练自动化、隐私保护 AutoML
- AutoML 伦理与责任:自动化决策的公平性、可解释性、透明度要求
适用读者
本书适合以下人群:
- 数据科学家和机器学习工程师希望提升工作效率
- 希望引入 AutoML 技术的企业技术团队
- 机器学习入门者希望降低学习曲线
- 软件工程师希望将机器学习集成到应用中
- 研究人员关注 AutoML 技术前沿发展
- 技术管理者评估 AutoML 工具的决策者
价值亮点
本书的核心价值:
- 技术深度:不仅介绍工具使用,更深入 AutoML 算法原理,理解自动化背后的数学
- 实践导向:大量真实案例和代码示例,可直接应用于实际项目
- 工具全面:覆盖主流开源和商业 AutoML 工具,提供选型指导
- 最新技术:包含神经架构搜索、元学习、联邦学习自动化等前沿内容
- 行业应用:金融、医疗、零售等行业的具体应用案例
- 平衡视角:分析 AutoML 的局限性,不盲目推崇自动化
- 中文作者:作者为华人学者,内容更贴近中文读者思维
阅读建议
建议具备机器学习基础再阅读本书,了解基本监督学习和深度学习概念。可以先从 Auto-sklearn 或 AutoKeras 等工具入手,体验 AutoML 的基本流程。重点关注第 2 章的端到端机器学习项目流程,这是理解 AutoML 价值的基础。对于技术团队,建议第 12 章的 AutoML 系统架构设计。实际项目中,可以先在非关键场景试点 AutoML,逐步建立团队信心。注意 AutoML 不是银弹,复杂问题仍需专家介入。完成本书后可进一步研究 AutoDL(自动化深度学习)和 AutoRL(自动化强化学习)等前沿方向。