4.7. 什么是 NVIDIA 管理库?(NVML)
NVIDIA 管理库(NVML)用于监控和管理 NVIDIA GPU 的状态。例如,它可以获取 GPU 的功耗、温度和已分配内存,以及设备的功率限制和功率限制状态等信息。关于这些指标的详细解释(包括如何解读功耗和温度读数),可参考 Modal 文档中的此页面。
NVML 的功能通常可通过 nvidia-smi 命令行工具访问,也能通过程序包装器供代码调用,例如 Python 中的 pynvml 和 Rust 中的 nvml_wrapper。