问题:部署了node-gpu-exporter,prometheus却无法手机信息,报context deadline exceeded。
解决:
网上好多介绍说改prometheus的配置scrape_timeout:600s,加大参数即可。
实际上没不好使。
最后加大exporter的资源限制解决。
resources:
requests:
memory: 30Mi
cpu: 100m
limits:
memory: 200Mi
cpu: 500m
参考:https://github.com/prometheus/prometheus/issues/2459