Cloud Alert 的部分应用部署在阿里云上,使用了多方面的监控服务:
- 阿里自身的ECS服务器和网站。
- Zabbix 监控服务器应用程序。
- OneAPM 的应用级监控。
- 腾讯云拨测,做网站监控。
腾讯云和阿里云的网站监控,总体来说腾讯云的云拨测告警延迟大一些。所以我们就强烈要求 Cloud Test 云测开发网站监控功能,这里就不打广告了。
使用过程中存在一些问题:
- 监控工具多,告警不是很方面集中跟踪,所以需要集中告警平台。
- 漏告警,深更半夜基本上很容易遗漏。阿里云监控告警仅告一次,不小心就漏了。毕竟不会挨个短信/邮件去跟踪。
Cloud Alert 自身就是集中告警云平台,所以我们自己就把阿里云告警和其他监控工具的接入进来,并且设置了告警自动升级策略ÿ