--昨夜西风凋碧树,独上高楼,望尽天涯路
当部署规模变大之后,可视化监控容器环境的性能和健康状态是十分重要的。
下面我们讨论几种流行的监控方案
-
Docker自带监控命令
1.docker container ps
ls是新添加的命令含义可能比ps更准确,推荐使用 :
2.top
docker container top [container]可以查看容器中运行了哪些进程:
上面显示了web1中的进程,命令后面还可以跟上Linux操作系统ps命令的参数显示特定的信息,比如-au
3.stats
docker container stats用于显示每个容器各种资源的使用情况:
注:容器启动时如果没有指定内存limit等,stats命令会显示host的内存总量,但这并不意味着每个container都能使用到这么多内存 。
也可以在docker container stats后面指定想监控的容器,如docker container stats web1 web2:
-
sysdig
sysdig是一个轻量级的系统监控工具,同时还原生支持容器。
sysdig将linux上很多常用的监控工具,比如strace、tcpdump、htop、iftop、lsof...集成到一个工具中,并且提供了友好统一的操作界面。
执行命令
docker container run -it --rm --name=sysdig --privileged=true --volume=/var/run/docker.sock:/host/var/run/docker.sock --volume=/dev:/host/dev --volume=/proc:/host/proc:ro --volume=/boot:/host/boot:ro --volume=/lib/modules:/host/lib/modules:ro --volume=/usr:/host/usr:ro sysdig/sysdig
sysdig以privilege方式运行,读取操作系统/dev、/proc等数据。
通过docker container exec -it sysdig bash进入容器,执行csydig,以交互方式启动sysdig:
-
Weave Scope
1.安装
执行如下脚本下载weavescope:
curl -L git.io/scope -o /usr/local/bin/scope
修改权限:
chmod a+x /usr/local/bin/scope
scope launch以容器方式启动weave scope:
访问Weave Scope地址http://192.168.46.116:4040/
2.容器监控
Weave Scope地图显示了当前运行的容器。Weave Scope将容器分为两类:Weave自己的容器System Container和其他容器Application Container,默认只显示后者。
Weave界面是一个可交互的地图。
可以监控内存,CPU使用量:
可以监控host:
并且可以通过容器的运行状态、是系统容器或应用容器、网络状态等进行容器的过滤:
Weave Scope还提供了容器的启动,停止,暂停,attach/exec进行可视化交互等:
可以编写规则进行过滤:
以及可以通过scope launch IP1 IP2进行多主机监控:
-
cAdvisor
cAdvisor是谷歌开发的监控工具
在host中运行:
docker run --volume=/:/rootfs:ro --volume=/var/run:/var/run:rw --volume=/sys:/sys:ro --volume=/var/lib/docker/:/var/lib/docker:ro --publish=8080:8080 --detach=true --name=cadvisor google/cadvisor:latest
通过访问http://hostip:8080访问。
1.监控Docker host
cAdvisor会显示当前host的资源使用情况,包括CPU、内存、网络、文件系统等。
点击docker containers,显示容器列表:
选择一个容器进入:
cAdvisor的主要功能,总结起来有两点:
(1)展示Host和容器两个层次的监控数据
(2)展示历史变化数据
cAdvisor的优缺点:
缺点:操作界面简陋,需要在不同界面之间跳转,只能监控一个host。
优点:可以将监控数据导出到第三方工具,由这些工具进一步加工处理。
-
Prometheus
Prometheus是一个非常优秀的监控工具。Prometheus提供了监控数据搜集、存储、处理、可视化和告警一套完整的解决方案。
Prometheus提供了多维数据模型:
Prometheus可以定义一个全局指标,然后通过添加不同的维度来满足不同的业务需求。
首先看一下prometheus官网给出的架构图:
下面我们主要关注这些组件即可:
1.Prometheus Server
主要负责从Exporter拉去和存储监控数据,并提供一套灵活的查询语言(PromQL)。
2.Exporter
负责收集目标对象(host、container等)的性能数据,并通过HTTP接口供Prometheus Server获取
3.可视化组件
4.Alertmanager
可以定义基于监控数据的告警规则,规则会出发警告。当Alertmanager收到告警,会通过预定义的方式发出告警通知。支持的方式包括Email、PagerDuty、Webhook等。
下面我们来实践一下Prometheus:
1.环境
通过Prometheus监控两台Docker host。
host1:
host2:
需要的组件:
(1)Prometheus Serve
(2)Exporter:收集数据(Node Exporter收集host硬件和操作系统数据;cAdvisor收集容器数据)
(3)Grafana:可视化
2.运行Node Exporter
在两个docker host上都执行:
docker run -d -p 9100:9100 -v "/proc:/host/proc" -v "/sys:/host/sys" -v "/:/rootfs" --net=host prom/node-exporter --path.procfs /host/proc --path.sysfs /host/sys --collector.filesystem.ignored-mount-points "^/(sys|proc|dev|host|etc)($|/)"
使用--net=host,使得Prometheus Server可以直接与Node Exporter(下面使用--net=host也是一样)
访问http:192.168.46.116:9100/和http:192.168.46.117:9100/测试:
3.运行cAdvisor
在两个host上执行:
docker run --volume=/:/rootfs:ro --volume=/var/run:/var/run:rw --volume=/sys:/sys:ro --volume=/var/lib/docker/:/var/lib/docker:ro --publish=8080:8080 --detach=true --name=cadvisor --net=host google/cadvisor:latest
访问http:192.168.46.116:8080/和http:192.168.46.117:8080/测试:
4.运行Prometheus Server
将Prometheus Server的配置文件prometheus.yml放在/root下挂载到容器中,所以我们首先在/root下建立prometheus.yml文件(如果不新建,默认创建的是目录),并且修改配置为:
在host1上执行:
docker run -d -p 9090:9090 -v /root/prometheus.yml:/prometheus.yml --name prometheus --net=host prom/prometheus
指定从哪些exporter抓取数据(这里指定了两台host上的Node Exporter和cAdvisor)。
另外local host:9090是Prometheus Server自己,可见Prometheus本身也会收集自己的监控数据。
先访问http:192.168.46.116:9090/测试:
通过http://192.168.46.116:9090测试:
5.运行Grafana
在host1上执行如下命令:
docker run -d -i -p 3000:3000 -e "GF_SERVER_ROOT_URL=http://grafana.server.name" -e "GF_SECURITY_ADMIN_PASSWORD=secret" --net=host grafana/grafana
-e "GF_SECURITY_ADMIN_PASSWORD=secret"指定了Grafana admin用户密码secret。
启动Grafana后,打开http://92.168.46.116:3000/
登陆后配置DataSource
然后我们在garfnana的官网上面下载Dashboard。
访问:https://grafana.com/dashboards?dataSource=prometheus&search=docker下载一个Dashboard:
点击左侧+号,导入下载好的Dashboard:
效果如下:
总结一下这几种监控方案:
Docker ps/top/stats | Sysdig | Weave Scope | cAdvisor | Prometheus | |
部署容易度 | 非常简单 | 非常简单 | 简单 | 非常简单 | 一般 |
数据详细度 | 一般 | 非常简单 | 非常简单 | 一般 | 非常简单 |
多Host监控 | none | none | 非常简单 | none | 非常简单 |
告警功能 | none | none | none | none | 简单 |
监控非容器资源 | none | 一般 | 一般 | 困难 | 非常简单 |