Scaling Python with Ray
作者: Holden Karau and Boris Lublinsky
语言: 英文
出版年份: 2022
编程语言: Python
下载链接:
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。

书籍摘要

本书由 Holden Karau 和 Boris Lublinsky 联合撰写,由 O’Reilly Media 出版。Holden Karau 是 Apache Spark 的提交者、Apache 软件基金会成员,拥有丰富的分布式计算和开源贡献经验。Boris Lublinsky 是 IBM Discovery Accelerator Platform 的首席架构师,专注于 Kubernetes、无服务器计算、工作流和复杂系统设计,著有多部技术书籍。

内容概述

《Scaling Python with Ray》是一本专注于使用 Ray 框架扩展 Python 应用程序的实用指南。随着机器学习(ML)在各行业的广泛应用,对可扩展计算的需求日益增长。本书旨在帮助开发者和数据科学家在不成为系统管理员的情况下,构建和扩展 Python 应用程序,从而应对日益复杂和大规模的问题。

主要内容

第一部分:Ray 基础

  • 第 1 章:介绍 Ray 的起源、目标及其在计算生态系统中的定位。Ray 是一个用于快速简单分布式计算的 Python 工具,由加州大学伯克利分校的 RISELab 创建,支持多种可扩展编程模型,包括演员模型、机器学习和数据并行。
  • 第 2 章:指导读者如何在本地安装 Ray,并通过示例展示如何使用 Ray 的核心 API,如远程函数和演员模型。介绍了 Ray 的安装方法,包括从 PyPI 安装预编译包和从源代码构建。
  • 第 3 章:深入探讨 Ray 的远程函数特性,包括如何创建远程函数、等待函数完成以及获取结果。还讨论了远程函数的生命周期、故障恢复机制和最佳实践。

第二部分:Ray 的高级特性

  • 第 4 章:详细介绍了 Ray 的远程演员模型,包括如何创建、管理和扩展演员。探讨了演员的生命周期、故障恢复和持久化策略。
  • 第 5 章:探讨了 Ray 的设计细节,包括故障恢复、资源管理、对象存储和序列化机制。介绍了 Ray 的全局控制存储(GCS)、分布式调度器和对象存储的架构。
  • 第 6 章:介绍了如何使用 Ray 实现流式应用程序。虽然 Ray 本身不是流式系统,但可以通过与 Kafka 等工具集成来实现流式处理。

第三部分:Ray 在机器学习中的应用

  • 第 7 章:介绍了 Ray Serve,一个用于构建微服务和模型服务的框架。展示了如何使用 Ray Serve 部署机器学习模型,并讨论了模型服务的要求和最佳实践。
  • 第 8 章:探讨了 Ray Workflows,一个用于构建和管理复杂工作流的工具。介绍了如何使用 Ray Workflows 构建动态工作流,并与其他 Ray 原语集成。
  • 第 9 章:讨论了 Ray Datasets,一个用于处理大规模数据集的工具。介绍了如何创建、保存和操作 Ray Datasets,并与其他数据处理工具集成。

第四部分:企业级部署

  • 第 10 章:介绍了如何在企业环境中部署 Ray 应用程序。讨论了安全性、多租户、CI/CD 工具集成和监控等关键问题。
  • 第 11 章:探讨了如何在 Ray 中使用 GPU 和其他加速器。介绍了如何请求和释放 GPU 资源,并讨论了使用 GPU 的最佳实践。

适用读者

本书适合有一定 Python 基础的开发者和数据科学家,尤其是那些希望在分布式环境中扩展其应用程序和机器学习模型的读者。无论是初学者还是有经验的从业者,都可以从本书中获得关于如何使用 Ray 构建可扩展系统的实用知识。

总结

《Scaling Python with Ray》是一本全面且实用的指南,涵盖了从 Ray 的基础安装到高级特性和企业级部署的各个方面。通过丰富的示例和详细的解释,本书帮助读者深入理解 Ray 的强大功能,并展示了如何将其应用于实际问题。无论是在本地开发还是在大规模集群环境中,Ray 都能显著简化分布式计算的复杂性,使开发者能够更高效地构建和扩展 Python 应用程序。

期待您的支持
捐助本站