最近在研究服务端的监控报警,通过手动配置报警规则
1.昨日同比 上周同比,上上周同比 2.连续xx 发现都会误报. 主要原因在于小流量,不稳定,波动较大. 日周期性的前提来配置不正确. 如果可以动态波动率就好了. 然后发现其实已经有人做过免配置的自动化报警.
1.自动得到周期性 2.计算出基准线和指标 3.通过预测算法报警.(设置三档报警敏感度) 4.一天的阈值信息不变. 异常天不覆盖之前的配置
阿里智能监控: https://www.usenix.org/conference/srecon17asia/program/presentation/wang?spm=ata.13261165.0.0.26743c72ZZKZLE(这个只有监控报警,无法维度信息的定位.)
TcpRT: Instrument and Diagnostic Analysis System for Service ality of Cloud Databases at Massive Scale in Real-time数据量少的话,只能通过自动化测试来验证了. 把周期性不明确的整理出来,专门进行自动化测试.
大数据算法 :
BloomFilter算法概述
可用于
1. 服务器接口稳定性报警
2. 业务风控系统_和服务端监控类似_相比更关注个体异常_机器学习_难度更大