异常点检测算法基本篇
参考文献:
https://www.cnblogs.com/pinard/p/9314198.html
1.算法测试
算法测试的流程其实很简单,只有三步:
构造输入
使用构造的输入来运行算法
获得输出,并使用算法的输出来计算各项指标值,对算法做出评价
把算法作为一个黑盒,测试需要做的就是完成第一步和第三步。其中最重要的又是第一步,因为输入确定了,输出基本就是确定的,不同点只是在于你如何分析而已。那么如何构造输入呢?有两种方法,一是手工构造数据集,优点是较简单,可以随意构造,缺点是无法反应线上的真实情况,会出现大量的漏测场景。还有一种方式是直接使用线上的数据,优点是场景覆盖全面,缺点是数据收集较为耗时。如果能构造一个测试系统,使得线上数据的收集=》算法运行=》输出评价成为一个完全自动化的流程,那么可以极大的提高算法测试的效率和有效性。
下面将以无人值守发布系统的算法测试为例,介绍一下上述测试思路的一种实现方法。
无人值守发布
无人值守发布(RiskFree)着力与解决快速分析新版本的应用的各项指标以识别异常,拦截有问题的发布,降低发布导致的故障率。无人值守发布系统的输入主要有三个