版本
prometheus-2.19.2
node_exporter-1.0.1
grafana-6.7.4
mysqld_exporter-0.11.0
process-exporter-0.6.0
redis_exporter-v1.3.5
blackbox_exporter-0.17.0
新手大礼包只需1积分,版本,模板,配置
https://download.csdn.net/download/u014756339/12675606
问题一:新建用户时,没点击跳过发送邮件,那时我的版本为grafana-7.1.0当时最新版,找到文件defaults.ini或者grafana.ini,阿里云企业邮件发送报错,费了大半天!!
根据配置邮件配置,我是源码包安装的文件在defaults.ini,tm第一次用阿里云企业邮件,报错526,木有看错,我禅道也是用的同一个阿里云企业邮箱发送ok,不知道是不是没给交钱,降版本,度娘都不行一直526,最后就想换了个其它邮箱,呵呵,正常发送。
[smtp]
enabled = true
host = smtp.163.com:465
user = 123@163.com
# If the password contains # or ; you have to wrap it with triple quotes. Ex """#password;"""
password = 123456
cert_file =
key_file =
skip_verify = false
from_address = 123@163.com
from_name = Grafana
ehlo_identity =
[emails]
welcome_email_on_sign_up = false
templates_pattern = emails/*.html
问题二:Node Exporter的grafana模板,内存的已用、可用、使用率等显示不出来?
解决方案一:centos7版本正常使用
解决方案二:显示不出的是centos6版本,刚好我两个版本都有用,centos版本用的少只用2台,修改模板代码,发图
例如
原模板的内存已用是:
node_memory_MemTotal_bytes{instance=~"$node"} - node_memory_MemAvailable_bytes{instance=~"$node"}
修改为
node_memory_MemTotal_bytes{instance=~"$node"} - node_memory_MemFree_bytes{instance=~"$node"} - node_memory_Buffers_bytes{instance=~"$node"} - node_memory_Cached_bytes{instance=~"$node"}
解释一下:不同地方
node_memory_MemAvailable_bytes 空闲的意思
node_memory_MemFree_bytes 空闲的意思
其它几项显示自行对照修改
内存使用率修改为
(node_memory_MemTotal_bytes{job=~"$job"} - node_memory_MemFree_bytes{job=~"$job"} - node_memory_Buffers_bytes{job=~"$job"} - node_memory_Cached_bytes{job=~"$job"})/ (node_memory_MemTotal_bytes{job=~"$job"})* 100
问题三:Node Exporter多台合在一个模板上查看,感觉显示数据不对!
把prometheus.yml的instance标签改为group了,别问我用不用consul自动注册,问就是觉得consul自动注册(还是要写字)比我写ip还麻烦,没有一篇小白给我看,懒得弄。
- job_name: 'prometheus_node'
static_configs:
- targets: ['1.1.0.226:9100','1.1.88.161:9100','1.1.88.158:9100',]
labels:
group: prometheus_node
问题四:blackbox模板一处小改动和prometheus.yml每个网站配置单独写出来,网站监控
下载模板的是下图
改动模板,增加个instance和group如下图,这是为了分清post了那个网站域名
本来想写到一起的,模板的网站会合在一起,还会显示ip,所以分开了,谁有好的点子分享一下来 prometheus.yml配置
- job_name: web2_status
metrics_path: /probe
params:
module: [http_2xx]
static_configs:
- targets: ['https://www.2222.com']
labels:
instance: www.2222.com
group: web
relabel_configs:
- source_labels: [__address__]
target_label: __param_target
- target_label: __address__
replacement: 1.1.1.1:9115
- job_name: web3_status
metrics_path: /probe
params:
module: [http_2xx]
static_configs:
- targets: ['https://www.1111.com']
labels:
instance: www.1111.com
group: web
relabel_configs:
- source_labels: [__address__]
target_label: __param_target
- target_label: __address__
replacement: 1.1.1.1:9115
问题5,邮箱面板,报警设置。没有用promethus的报警 用grafana的,暂时支持的graph面板报警