云监控定义
云监控(Cloud Monitor Service) 简称CMS,是一个开放式的监控平台,实时监控你的站点和服务器,并以多种告警方式(短信、旺旺、邮件)完成报警。
云监控的特点: [记住没有实时性的特点,因为其他的监控都有实时性的特点;这个实时性不是阿里云独有的特点]
- 开放性:
1). 监控点是分布式,支持多IDC 的接入 (在不同的机房检测你的网站、服务是否正常);
2). 开放API,用户可以灵活接入;开放数据接口和规则,允许用户自定义监控项
- 网络优势:
1). 监控数据在多个IDC 之间走阿里内网,不会占用公网资源,而且传输比较快;支持BGP 骨干网
2). 会在被监控的机器上安装插件程序,这个程序会收集监控数据通过内网传输给一个控制台;这个控制台统一进监控的报警、报表
- 开放平台:
1). 对监控数据进行统计,从各个纬度反馈服务的运行状态
2). 对监控数据支持无线存储,随时可以看到过去所有的历史数据
7.1.2 云监控的功能概要
1. 站点监控:
包括http/ping/dns/tcp/upd/smtp/pop3/ftp 等服务的可用性和响应时间进行监控、统计报警
2. 云产品监控
提供SLB ECS ESS RDS OCS CDN OSS 等云产品的监控、报警服务
3. 自定义监控
运行用户自己定义监控,对自己的web服务器 apache、nginx、tomcat 的服务是否正常的监控
4. 报警和联系人管理
- 报警:对某一个参数(比如cpu 利用率)达到一个阈值,然后进行报警
- 报警联系人:有报警接收组(多个人共同接收)的概念,统一管理报警联系人
- 报警方式:支持短信、电话、旺旺、邮件;但不支持钉钉
7.1.3 云监控的应用场景
- 云运维人员了解网络的情况、业务的情况、服务的情况
- ECS 升级时了解网络情况,为后续网络升级提供系统指标
- 网络升级后,SLB的负载的状况
- 监控数据可以作为触发ESS 触发弹性伸缩活动的条件
7.1.4 云监控的相关概念
- 监控项: 用户设置或者系统默认的监控类型
比如http 站点服务的监控包括2个监控项: http.reponseTime http.status;又比如cpu、内存、磁盘利用率
- 监控点: 一个监控像有一个监控点
比如一台ECS 实例默认有11个监控项,那就有一个监控点;监控项也可以自定义扩展
- 监控的纬度: 监控多个纬度
- 规则:比如cpu > 70% 报警,ecs 安全组可用机器比例 < 30% 报警
- 报警组:一个报警组可以包括多个联系人
- 报警时间:可以设置9点 --18点,上班时间报警,其他时间不报警
- 报警方式: 短信、电话、旺旺、邮件
7.2 站点级监控
7.2.1 HTTP 监控
HTTP 包括head和body 2部分,默认加 HTTP.reponsetime http.status 2个监控项