Streaming Data
作者: Andrew G. Psaltis
语言: 英文
出版年份: 2017
下载链接:
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。

书籍摘要

《Streaming Data》是一本由 Andrew G. Psaltis 编写的关于实时数据流处理的权威指南,深入探讨了从数据收集到分析、存储以及最终呈现的完整流式数据处理架构。本书不仅涵盖了流式数据处理的理论基础,还提供了丰富的实践案例和代码示例,帮助读者构建高效、可扩展的实时数据系统。

核心内容概述

第一部分:全新的整体方法

  • 第1章:介绍流式数据
    定义了实时系统与流式数据系统的区别,提出了流式数据架构蓝图,强调了安全性和可扩展性的重要性。
  • 第2章:从客户端获取数据
    详细介绍了数据收集的交互模式,包括请求/响应、发布/订阅、单向模式等,并探讨了如何通过故障容错技术确保数据不丢失。
  • 第3章:从收集层传输数据
    讨论了消息队列层的作用,包括消息持久化、消息传递语义(如“至多一次”、“至少一次”、“恰好一次”)以及如何选择合适的消息队列技术。
  • 第4章:分析流式数据
    深入探讨了流式数据的分析架构,包括分布式流处理框架的关键特性,如消息传递语义、状态管理和容错机制。
  • 第5章:数据分析算法
    介绍了流式数据处理中的常见算法,如滑动窗口、随机抽样、计数唯一元素等,并讨论了如何在流式数据中处理时间问题。
  • 第6章:存储分析或收集的数据
    分析了在流式数据处理中存储数据的需求,包括长期存储和内存存储的选项,以及如何选择合适的存储解决方案。
  • 第7章:使数据可用
    探讨了如何将分析后的数据通过不同的通信模式(如数据同步、远程方法调用、发布/订阅)和协议(如 Webhooks、HTTP 长轮询、服务器发送事件、WebSockets)推送给客户端。

第二部分:真实世界的应用

  • 第9章:实时分析 Meetup RSVPs
    通过构建一个完整的流式数据管道,展示了如何将前面章节的理论应用于实际场景。以 Meetup RSVP 流数据为例,详细介绍了从数据收集、消息队列、数据分析到数据呈现的全过程,并提供了完整的代码实现。

书籍特色

  • 理论与实践相结合:不仅提供了流式数据处理的理论知识,还通过实际案例和代码示例帮助读者理解和应用。
  • 全面覆盖:从数据的收集、传输、分析到存储和呈现,涵盖了流式数据处理的每一个环节。
  • 技术深度:深入探讨了分布式流处理框架、消息队列技术、数据分析算法等关键领域,适合有一定技术基础的读者。
  • 实用性:提供了完整的代码和部署指南,帮助读者快速构建和部署自己的流式数据系统。

适用读者

本书适合开发者、架构师以及对流式数据处理感兴趣的业务决策者。无论是初学者还是有一定经验的专业人士,都能从本书中获得宝贵的指导和参考。

《Streaming Data》是一本全面、深入且实用的流式数据处理指南,无论是理论学习还是实际应用,都能为读者提供极大的帮助。

期待您的支持
捐助本站