4.14. 什么是 NVIDIA CUDA 性能分析工具接口?(CUPTI)

NVIDIA CUDA性能分析工具接口(CUDA Profiling Tools Interface,简称 CUPTI)提供了一套API,用于分析在 GPU 上执行的 CUDA C++PTXSASS 代码的执行情况。关键在于,它能同步 CPU 主机和 GPU 设备之间的时间戳,确保性能数据的准确性。

CUPTI 的接口被诸如 NSight Systems 性能分析器PyTorch Profiler 等工具所使用。

您可以在 此处 找到其文档。

有关在 Modal 上运行的 GPU 应用程序使用性能分析工具的详细信息,请参阅 我们文档中的此示例