控制 AWS p2 实例的 GPU 频率

AWS p2 实例虽然方便，不用本地买显卡，但是碰到比较大的网络，p2 开一天就得 50 块钱，还是有点肉疼的。那么，既然付了钱，就把实例的性能发挥到极致吧。

Tesla K80 显卡通常工作在 AutoBoost 模式，这个模式会动态调整显卡的频率，在很多情况下都比最大频率要低，并且显卡驱动默认的功率限制并没有被开到最大，因此这两点都会影响我们最终获得的性能。

设置显卡工作频率比较简单：

sudo nvidia-persistenced
sudo nvidia-smi --auto-boost-default=0
sudo nvidia-smi -ac 2505,875 #(2505,875) for p2; (877,1530) for p3; (2505,1177) for g3

关于功率的调整，首先我们要查看显卡的最大功率限制 nvidia-smi -q | grep 'Power Limit'，如果是 p2 实例，发现这个值是 175W，而驱动默认的限制是 149W，我们需要提高这个限制，使用 nvidia-smi -pl 175 即可，如果权限不足，用 sudo 运行。

参考资料：

https://www.ibm.com/support/knowledgecenter/en/SSFHY8_5.5.0/com.ibm.cluster.essl.v5r5.essl100.doc/am5gr_nvidcap.htm
https://devblogs.nvidia.com/increase-performance-gpu-boost-k80-autoboost/
https://docs.aws.amazon.com/zh_cn/AWSEC2/latest/UserGuide/optimize_gpu.html

GLORIOUS DAYS

「私が戻ってきたのはね。もう一度、星の音を聞くためだよ」—— 姫野星奏

控制 AWS p2 实例的 GPU 频率

发表回复取消回复

GLORIOUS DAYS

发表回复 取消回复

GLORIOUS DAYS

发表回复取消回复