# 什么是 CUDA 线程? ![](light-cuda-programming-model.svg) > 线程是线程组层次结构中的最低层级(顶部、左侧),并被映射到 [流式多处理器](/gpu-glossary/device-hardware/streaming-multiprocessor) 的 [核心](/gpu-glossary/device-hardware/core) 上。改编自 NVIDIA 的 [CUDA 复习:CUDA 编程模型](https://developer.nvidia.com/blog/cuda-refresher-cuda-programming-model/) 和 NVIDIA [CUDA C++ 编程指南](https://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#programming-model) 中的图表。 _执行线程_(简称"线程")是 GPUs 编程的最小单位,也是 [CUDA 编程模型](/gpu-glossary/device-software/cuda-programming-model) 中 [线程层次结构](/gpu-glossary/device-software/thread-hierarchy) 的基础和原子单位。线程拥有独立的 [寄存器](/gpu-glossary/device-software/registers),但除此之外几乎没有其他资源。 [SASS](/gpu-glossary/device-software/streaming-assembler) 和 [PTX](/gpu-glossary/device-software/parallel-thread-execution) 程序都以线程为执行目标。相比之下,POSIX 环境中的典型 C 程序以进程为目标,而进程本身是一个或多个线程的集合。与 POSIX 线程不同,[CUDA](/gpu-glossary/device-software/cuda-programming-model) 线程不用于执行系统调用。 与 CPU 上的线程类似,GPU 线程可以拥有私有的指令指针/程序计数器。但是出于性能考虑,GPU 程序通常被编写为让一个 [线程束](/gpu-glossary/device-software/warp) 中的所有线程共享相同的指令指针,并以锁步方式执行指令(另请参阅 [线程束调度器](/gpu-glossary/device-hardware/warp-scheduler))。 同样类似于 CPU 上的线程,GPU 线程在 [全局内存](/gpu-glossary/device-hardware/gpu-ram) 中拥有栈,用于存储溢出的寄存器和函数调用栈,但高性能 [内核](/gpu-glossary/device-software/kernel) 通常限制这两者的使用。 单个 [CUDA 核心](/gpu-glossary/device-hardware/cuda-core) 执行来自单个线程的指令。