2.16. 什么是 GPU RAM?
在像 H100 这样的高性能数据中心 GPU 中,RAM 位于与处理器芯片相邻的芯片上。改编自维基百科关于 高带宽内存 的页面。
GPU 的底层内存是一种大容量(从数 MB 到数 GB)的存储区域,可被 GPU 的所有 流式多处理器 (SM) 寻址。
它也被称为 GPU RAM(随机存取存储器)或显存 (VRAM)。它使用动态 RAM (DRAM) 单元,比 寄存器文件 和 L1 数据缓存 中使用的静态 RAM (SRAM) 相比,DRAM 速度更慢但体积更小。有关 DRAM 和 SRAM 的详细信息,我们推荐 Ulrich Drepper 2007 年的文章 “程序员应了解的内存知识”。
通常,底层内存与 流式多处理器 (SM) 不在同一芯片上,不过在最新的数据中心级 GPU(如 H100)中,内存通过共享 中介层 连接,以降低延迟并提高 内存带宽。这些 GPU 使用 高带宽内存 (HBM) 技术,而不是消费级 GPU 和 CPU 中更常见的双倍数据速率 (DDR) 内存。
RAM 用于实现 CUDA 编程模型 的 全局内存,并存储从 寄存器文件 溢出的 寄存器 数据。
H100 可以在其 RAM 中存储 80 GiB (687,194,767,360 位)。