2.10. 什么是流式多处理器架构?
流式多处理器 (SM) 采用特定”架构”进行版本管理,该架构定义了它们与 流式汇编器 (SASS) 代码的兼容性。
采用”Hopper” SM90 架构的流式多处理器。修改自 NVIDIA 的 H100 白皮书。
具有原始”Tesla” SM 架构的流式多处理器。修改自 Fabien Sanglard 的博客。
大多数 SM 版本包含两个组成部分:主版本号和次版本号。
主版本 几乎 等同于 GPU 架构系列。例如,所有 6.x 版本的 SM 都属于 Pascal 架构。 一些 NVIDIA 文档甚至 直接声称这一点。
但举例来说,Ada GPU 的SM 架构版本为 8.9,与 Ampere GPU 的主版本相同。
在调用 NVIDIA CUDA 编译器驱动程序 (nvcc) 时,可以指定 SASS 编译的目标 SM 版本。主版本号之间的兼容性无法保证性。有关跨次版本兼容性的更多信息,请参阅nvcc 的文档。