Parallel and High Performance Computing
作者: Robert (bob) Robey and Yuliana (yulie) Zamora
语言: 英文
出版年份: 2021
下载链接:
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。

书籍摘要

核心定位

这本书不是偏理论的并行算法教材,也不是只教某一套框架语法的手册,而是一本把“性能思维”落到工程实践的 HPC 入门到进阶指南。作者从为什么要并行、怎样估算收益与上限讲起,再一路推进到 CPU 向量化、OpenMP、MPI 与 GPU,加上 profiling、数据布局、能耗与可移植性,目标是帮助读者把程序真正跑快,而不是只把代码改成“能并行”。

内容主线

全书主线很清晰:先建立并行计算的收益边界与硬件/软件模型,再学习在改造旧项目时如何做版本管理、测试、内存检查、基准测试与性能画像;随后进入数据结构、缓存、性能模型与并行模式,最后按硬件平台展开 CPU、分布式通信和 GPU 加速。它强调的不是孤立技巧,而是“测量—建模—重构—实现—验证”的完整闭环。

章节内容

第一部分先解释并行计算的价值与风险,借助 Amdahl 定律、Gustafson-Barsis 定律、异构系统模型、profiling、带宽与 FLOPs 上限、AoS/SoA/AoSoA、缓存失效和性能模型,让读者知道瓶颈应如何被识别与量化。

第二部分转向 CPU 侧实战,先讲向量化与 SIMD,再进入 OpenMP 的循环级并行、高层并行、任务支持、线程工具,以及 MPI 的点对点通信、集体通信、ghost cell 交换与 MPI+OpenMP 混合方案,覆盖共享内存到分布式内存的主流路径。

第三部分把重点放到 GPU 架构与加速平台,说明 CPU-GPU 协同、线程执行模型以及不同 GPU 类型的定位,延续全书一贯的“先理解硬件,再设计实现”的方法。

适用读者

适合已经会写 C/C++ 或科学计算程序、想系统进入 HPC 的工程师、科研开发者和性能优化人员。若你只想快速学会某个 API 的基本用法,这本书信息密度会偏高;若你缺少基本编程、数据结构和编译运行经验,读起来也会吃力。

总评

这本书的价值在于把并行计算从“会几个框架命令”提升到“能围绕体系结构做性能决策”。它既给出 OpenMP、MPI、GPU 这些常用工具,也反复强调测试、画像、数据设计和可扩展性判断。对希望建立长期 HPC 工程能力,而不是只完成一次课程作业的读者,这本书很值得投入时间。

期待您的支持
捐助本站