Deep Learning at Scale
作者: Suneeta Mall
语言: 英文
出版年份: 2024
其他分类: 人工智能
下载链接:
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。

书籍摘要

《Deep Learning at Scale》是由Suneeta Mall撰写的一本专注于大规模深度学习实践的书籍,于2024年6月由O’Reilly Media出版。本书旨在帮助读者深入理解和掌握如何在大规模场景下高效地开发、训练和部署深度学习模型,涵盖了从基础概念到分布式训练和极端扩展的全方位内容。

作者背景与写作动机

Suneeta Mall是一位经验丰富的软件工程师和机器学习专家,曾在多个领域从事深度学习、机器学习工程、DevOps和MLOps等工作。她目睹了深度学习在解决复杂问题时的高效能力,但也深知在大规模场景下构建和管理深度学习系统的复杂性。因此,她希望通过本书将这些宝贵的经验和知识分享给更多从业者,帮助他们跨越技术门槛,更高效地扩展深度学习工作负载。

书籍结构与内容

本书分为三个部分,共13章,内容层层递进,涵盖了深度学习的基础知识、分布式训练方法和大规模扩展技术。

第一部分:深度学习基础

  • 第1章:探讨了规模化的哲学和历史背景,分析了深度学习与规模化的关联,并讨论了在开始扩展之前需要考虑的关键问题。
  • 第2章:介绍了深度学习的基本概念,包括计算图和数据流,并通过Python实现简单的深度学习模型,帮助读者理解模型的内部工作机制。
  • 第3章:深入探讨了深度学习的计算层面,包括硬件加速、浮点数的表示和计算机架构的基础知识,为后续的扩展实践打下坚实基础。

第二部分:分布式训练

  • 第5章:介绍了分布式系统的概念和通信挑战,为理解分布式深度学习奠定了基础。
  • 第6章:详细讨论了分布式深度学习的理论基础,包括数据并行、模型并行等技术,并提供了选择合适分布式策略的框架。
  • 第7章:通过实际案例深入讲解了数据并行技术,帮助读者掌握如何通过数据并行扩展模型训练。
  • 第8章:探讨了模型、管道、张量和混合并行等高级并行技术,分析了它们的挑战和局限性。
  • 第9章:综合运用前面章节的知识,提供了实现多维并行的实用指导。

第三部分:极端扩展

  • 第10章:从数据角度出发,介绍了如何通过采样和选择技术最大化数据的收益,提升数据管道的效率。
  • 第11章:聚焦于大规模实验的规划和管理,探讨了如何通过实验设计和管理提高找到最佳模型的机会。
  • 第12章:通过实际案例讲解了如何对大型模型进行低秩微调,展示了在大规模场景下优化模型的实用方法。
  • 第13章:探讨了基础模型的概念和当前的发展趋势,为读者提供了这一领域的前沿视角。

适用读者

本书适合所有希望深入了解深度学习扩展技术的机器学习从业者,包括工程师、数据工程师、MLOps专家、深度学习科学家等。读者需要具备深度学习的基本知识,熟悉优化器、损失函数和模型构建等概念,并具备Python和PyTorch的实践经验。

特色与价值

  • 全面覆盖:从基础概念到高级扩展技术,本书为读者提供了一站式的深度学习扩展知识体系。
  • 实践导向:书中包含大量实际案例和练习,帮助读者将理论知识应用于实际问题。
  • 前沿视角:紧跟深度学习领域的最新趋势,如基础模型、混合并行技术等,为读者提供前沿视角。
  • 工具与技巧:详细介绍了如何选择合适的工具和技术,以及如何管理计算基础设施,帮助读者在实际工作中做出更明智的决策。

总之,《Deep Learning at Scale》是一本深度学习领域的实用指南,无论是对于希望提升模型性能的从业者,还是对于致力于构建大规模深度学习系统的团队,这本书都提供了极具价值的参考和指导。

期待您的支持
捐助本站