Parallel and High Performance Computing

作者：	Robert (bob) Robey and Yuliana (yulie) Zamora
语言：	英文
出版年份：	2021
下载链接：	PDF 城通网盘 EPUB 城通网盘 MOBI 城通网盘书籍均收集自互联网，仅供学习和研究使用，请莫用于商业用途。谢谢合作。

书籍摘要

核心定位

这本书不是偏理论的并行算法教材，也不是只教某一套框架语法的手册，而是一本把“性能思维”落到工程实践的 HPC 入门到进阶指南。作者从为什么要并行、怎样估算收益与上限讲起，再一路推进到 CPU 向量化、OpenMP、MPI 与 GPU，加上 profiling、数据布局、能耗与可移植性，目标是帮助读者把程序真正跑快，而不是只把代码改成“能并行”。

内容主线

全书主线很清晰：先建立并行计算的收益边界与硬件/软件模型，再学习在改造旧项目时如何做版本管理、测试、内存检查、基准测试与性能画像；随后进入数据结构、缓存、性能模型与并行模式，最后按硬件平台展开 CPU、分布式通信和 GPU 加速。它强调的不是孤立技巧，而是“测量—建模—重构—实现—验证”的完整闭环。

章节内容

第一部分先解释并行计算的价值与风险，借助 Amdahl 定律、Gustafson-Barsis 定律、异构系统模型、profiling、带宽与 FLOPs 上限、AoS/SoA/AoSoA、缓存失效和性能模型，让读者知道瓶颈应如何被识别与量化。

第二部分转向 CPU 侧实战，先讲向量化与 SIMD，再进入 OpenMP 的循环级并行、高层并行、任务支持、线程工具，以及 MPI 的点对点通信、集体通信、ghost cell 交换与 MPI+OpenMP 混合方案，覆盖共享内存到分布式内存的主流路径。

第三部分把重点放到 GPU 架构与加速平台，说明 CPU-GPU 协同、线程执行模型以及不同 GPU 类型的定位，延续全书一贯的“先理解硬件，再设计实现”的方法。

适用读者

适合已经会写 C/C++ 或科学计算程序、想系统进入 HPC 的工程师、科研开发者和性能优化人员。若你只想快速学会某个 API 的基本用法，这本书信息密度会偏高；若你缺少基本编程、数据结构和编译运行经验，读起来也会吃力。

总评

这本书的价值在于把并行计算从“会几个框架命令”提升到“能围绕体系结构做性能决策”。它既给出 OpenMP、MPI、GPU 这些常用工具，也反复强调测试、画像、数据设计和可扩展性判断。对希望建立长期 HPC 工程能力，而不是只完成一次课程作业的读者，这本书很值得投入时间。