作者: | Sean T. Allen, Matthew Jankowski and Peter Pathirana |
语言: | 英文 |
出版年份: | 2015 |
下载链接: |
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。 |
《Storm Applied》是一本专注于Apache Storm流处理框架的实用指南,由Sean T. Allen、Matthew Jankowski和Peter Pathirana三位在实时数据处理领域有着丰富经验的作者共同撰写。本书由Manning Publications于2015年出版,旨在帮助读者深入理解和掌握Storm在实时事件处理中的应用。
本书共分为九章,内容涵盖了从Storm的基本概念到高级应用的各个方面。
第一章介绍了大数据的定义以及Storm在大数据处理中的定位,强调了Storm作为实时流处理工具的优势。
第二章通过一个具体的案例——GitHub提交计数仪表板,详细讲解了Storm的核心概念,包括拓扑结构、元组、流、Spout和Bolt等,并展示了如何实现一个简单的Storm拓扑。
第三章进一步探讨了拓扑设计的最佳实践,通过社交热图案例,展示了如何将问题分解为Storm可以处理的形式,并讨论了并行化和扩展性问题。
第四章聚焦于Storm的可靠性特性,通过信用卡授权系统的案例,深入讲解了如何在Storm中实现消息的可靠处理,包括锚定、确认和失败机制。
第五章则介绍了如何将本地运行的拓扑迁移到远程Storm集群,并详细讲解了Storm集群的组成、故障恢复机制以及如何安装和部署Storm集群。
第六章和第七章分别探讨了Storm拓扑的调优和资源竞争问题,提供了实用的性能优化策略和解决资源竞争的方法。
第八章深入探讨了Storm的内部机制,包括执行器、任务、内部队列等,帮助读者更好地理解Storm的运行原理。
最后一章介绍了Trident——Storm的高级抽象层,通过互联网广播案例,展示了如何使用Trident实现复杂的流处理逻辑,并讨论了Trident与Storm原生API的对比。
《Storm Applied》适合对实时数据处理感兴趣的开发人员、数据工程师以及对Apache Storm有初步了解的技术人员。无论是初学者还是有一定经验的开发者,都能从本书中获得宝贵的实践经验和深入的技术见解。
本书的最大特色在于其实用性和案例驱动的教学方式。作者通过丰富的实际案例,逐步引导读者理解Storm的复杂概念,并提供了详细的代码示例和运行说明。此外,书中还涵盖了Storm在生产环境中的部署、监控和调优技巧,这些都是作者在实际工作中积累的宝贵经验。
总之,《Storm Applied》是一本全面、深入且实用的Storm学习指南,不仅能够帮助读者快速上手Storm开发,还能在生产环境中解决实际问题,是每一位Storm开发者的必备书籍。