1、PerfMon一直不显示图形。
在排除压测时间过短后,最后发现取消勾选仅错误日志,就会显示了。
2、perfMon 监控GPU服务器指令
在PerfMon 中添加
/bin/sh:-c:nvidia-smi --query-gpu=utilization.gpu --format=csv |tail -1>temp.txt; sed -i "s/%//g""temp.txt";cat temp.txt
用于监控GPU的使用率。
通过/bin/sh -c
来执行多个命令,并将结果输出到temp.txt
文件中。其中,nvidia-smi --query-gpu=utilization.gpu --format=csv |tail -1
命令用于获取GPU的利用率,并将结果输出到标准输出流中;sed -i "s/%//g" temp.txt
命令用于去除temp.txt
中的百分号符号;cat temp.txt
命令则用于将处理后的结果输出到标准输出流中。
碰到的问题:在执行指令时,ServerAgent一直报错No such file or directory,实际上temp.txt文件存在,手工执行命令又是可行的。给serverAgent 0777的权限,也没有解决问题。
最后发现是因为上级目录的owner 不是root,是其他用户。将ServerAgent文件夹放在root目录下,报错解决。