Programming Massively Parallel Processors Fourth Edition 学习摘录
本文主体摘抄于李理的博客,在其基础上选择了最核心最重要的部分,基本上是这本书的精简版,可用作复习和回顾使用 第一章:简介 1.1 异构并行计算 低延迟的算术单元、复杂的操作数传递逻辑、大缓存内存和控制逻辑消耗了本可以用于提供更多算术执行单元和内存访问通道的芯片面积和功耗。这种设计方法通常被称为面向延迟设计。 图1.1 CPU和GPU具有根本不同的设计理念:(A)CPU设计是面向延迟的;(B)G