2.11. 什么是纹理处理集群?(TPC)

纹理处理集群 (Texture Processing Cluster, TPC) 是一对相邻的 流式多处理器 (Streaming Multiprocessors, SMs)

在 Blackwell SM 架构 之前,TPC 并未映射到 CUDA 编程模型内存层次结构线程层次结构 的任何层级。

Blackwell SM 架构 中的第五代 Tensor Cores并行线程执行 (Parallel Thread eXecution, PTX)线程层次结构 中增加了 “CTA 对” 层级,该层级映射到 TPC。许多 tcgen05 PTX 指令包含一个 .cta_group 字段,可以使用单个 流式多处理器 (.cta_group::1) 或 TPC 中的一对 流式多处理器 (::2),并分别对应 MMA 等 流式汇编器 (Streaming Assembler, SASS) 指令(如 MMA)的 1SM2SM 变体。