4.14. 什么是 NVIDIA CUDA 性能分析工具接口?(CUPTI)
NVIDIA CUDA性能分析工具接口(CUDA Profiling Tools Interface,简称 CUPTI)提供了一套API,用于分析在 GPU 上执行的 CUDA C++、PTX 和 SASS 代码的执行情况。关键在于,它能同步 CPU 主机和 GPU 设备之间的时间戳,确保性能数据的准确性。
CUPTI 的接口被诸如 NSight Systems 性能分析器 和 PyTorch Profiler 等工具所使用。
您可以在 此处 找到其文档。
有关在 Modal 上运行的 GPU 应用程序使用性能分析工具的详细信息,请参阅 我们文档中的此示例。