互联网产品,除了线上关键服务的实时监控十分重要,其实各服务的具体接口监控也不容忽视。如果线上某个接口挂了,最直观的表现是App/Web端上刷不出数、超时或直接抛错误。而这类接口异常的排查可能比服务异常更费时费力。
如何对线上服务关键接口进行实时监控呢?
解决思路
1. 速成:在运维监控平台上配置监控接口,如: zabbix;
zabbix 配置监控接口 -> http://www.ttlsa.com/zabbix/zabbix-monitor-web-api/
2. 简单粗暴:运维童鞋对线上应用log进行实时监控过滤,可以通过python, shell 脚本简单处理。定义监控规则,如:监控频率、错误结果统计、错误告警提示等;
3. “高大上”自定义:选择开源监控项目进行二次开发维护,如: