目录
本文安装版本
grafana-6.4.2.linux-amd64.tar.gz
loki的日志监控安装包版本
loki-linux-amd64.zip
promtail-linux-amd64.zip
pometheus的监控安装包版本
node_exporter-1.1.2.linux-amd64.tar.gz
prometheus-2.35.0.linux-amd64.tar.gz
pometheus的监控
解压tar包:
tar -zxvf Prometheus和node-export的包
node_exporter的启动
node-export解压完直接就可以启动,这里可以指定port
/opt/node_exporter-1.1.2.linux-amd64/node_exporter --web.listen-address="ip:9100"
Prometheus的安装和启动
Prometheus解压完只需要配置prometheus.yml,添加监控的job
(base) [root@yxkj153 opt]# cd prometheus-2.35.0.linux-amd64/
(base) [root@yxkj153 prometheus-2.35.0.linux-amd64]# ll
total 198236
drwxr-xr-x 2 root root 23 May 6 17:32 config
drwxr-xr-x 2 3434 3434 38 Apr 21 17:59 console_libraries
drwxr-xr-x 2 3434 3434 173 Apr 21 17:59 consoles
drwxr-xr-x 10 root root 281 May 27 01:00 data
-rw-r--r-- 1 3434 3434 11357 Apr 21 17:59 LICENSE
-rw-r--r-- 1 3434 3434 3773 Apr 21 17:59 NOTICE
-rwxr-xr-x 1 3434 3434 105576684 Apr 21 17:55 prometheus
-rw-r--r-- 1 3434 3434 1730 May 26 23:57 prometheus.yml
-rwxr-xr-x 1 3434 3434 97394322 Apr 21 17:58 promtool
(base) [root@yxkj153 prometheus-2.35.0.linux-amd64]#
如上图的配置:
vi prometheus.yml
- job_name: 'node_exporter'
static_configs:
- targets: ['192.168.80.161:9100']
然后可以启动Prometheus
/opt/prometheus-2.35.0.linux-amd64/prometheus
通过命令行检查node-export的监控,
curl http://192.168.80.161:9100/metircs
或者通过网页看node-export的监控,显示成功
登录http://ip:port,查看Prometheus的界面
出现如下表示部署成功
然后可以看到node的监控指标
granfana的启动
也是直接解压,然后就可以启动
/opt/grafana-6.4.2/bin/grafana-server web
访问http://192.168.80.161:3000/,账号密码都是admin,添加data sources
然后点击 add source,添加Prometheus
然后导入export的插件,或者有实力可以自己开发一个监控模板,选择import
Prometheus已经提供了一些模板,https://grafana.com/grafana/dashboards,这里输入编码405,需要加载稍等一会,点击旁边的load,稍等一会,不用输入下面的json串,等加载完成点击下面的load。
granfana+node-expoter的视图:
granfana+Prometheus的试图:
这里就可以看出Prometheus里面监控的job已经都有了。例如我得zookeeper监控也能查到,如下
注:
可以查看启动参数帮助
/opt/grafana-6.4.2/bin/grafana-server --help
(base) [root@yxkj153 prometheus-2.35.0.linux-amd64]# ./prometheus --help
loki的日志监控
直接解压就可以
unzip 安装包
编写配置文件(启动需要)
vi promtail-local-config.yaml
server:
http_listen_port: 9080
grpc_listen_port: 0
positions:
filename: /data/promtail/positions.yaml
clients:
- url: http://192.168.80.161:3100/loki/api/v1/push
scrape_configs:
#- job_name: system
# static_configs:
# - targets:
# - localhost
# labels:
# job: varlogs
# __path__: /var/log/*log
- job_name: bdp
static_configs:
- targets:
- 192.168.80.161
labels:
job: nginxlogs
__path__: /tmp/*log
vi loki-local-config.yaml
auth_enabled: false
server:
http_listen_port: 3100 #监听的端口
ingester:
lifecycler:
address: 192.168.80.161
ring:
kvstore:
store: inmemory
replication_factor: 1
final_sleep: 0s
chunk_idle_period: 5m
chunk_retain_period: 30s
max_transfer_retries: 0
schema_config:
configs:
- from: 2022-05-25
store: boltdb
object_store: filesystem
schema: v11
index:
prefix: index_
period: 168h
storage_config:
boltdb:
directory: /data/loki/index #自定义boltdb目录
filesystem:
directory: /data/loki/chunks #自定义filesystem目录
promtail的启动
/opt/promtail-linux-amd64 -config.file=promtail-local-config.yaml
loki的启动
/opt/loki-linux-amd64 -config.file=loki-local-config.yaml
granfana添加loki
granfana怎么启动参考上面~添加loki也可以参考上面
然后去explore可以查看日志
我自己在promtail配置文件的监控目录下,自定义了一个文件。然后通过追加测试的。
echo "内容" >> /tmp/a.log
在此页面输入:
{filename="/tmp/a.log"}
遇到的问题
granfana的图标一直显示 ”no data“
解决办法:
1.需要机器之间的时间同步。
Prometheus就出现问题了。才导致granfana出现问题。
打开Prometheus的界面有个warning的提示,关于时间的。
可以参考我的另一篇博客解决
https://blog.csdn.net/MyNameIsWangYi/article/details/124562779?spm=1001.2014.3001.5502
https://blog.csdn.net/MyNameIsWangYi/article/details/124562779?spm=1001.2014.3001.5502
2.检查Prometheus的配置文件
添加job的时候,不要出现tab键。
3.检查loki,promtail的配置
把localhost换成具体的ip
4.granfana添加source的时候ip错误
我主要是这个,192写成182了,找了各种方法都没成功
5.只有个别图标显示no data
这个可以通过edit,修改表达式来实现展示视图
改成一个能执行的表达式。可以去Prometheus的 ip:9090端口测试一下表达式
第一次使用,记个笔记,希望对同样第一次使用的你有帮助~