异常检测项目整理
基于高斯分布的异常检测算法
收集特征:电机轴1到6,问问剑桥,那份文档每个参数啥意思。
假设机器数据符合高斯分布,如果不符合,就用对数函数转化为高斯分布。
一个机器的1轴和2轴分别作为特征点,在直角坐标系中形成了一个点,m个机器就会形成m个点,画图。对于一个新的机器,如果新机器的特征点偏离了这块区域,我们就说异常了。
具体实现算法:计算每个特征的平均值和方差,得到一个密度概率函数模型,对于新的特征点,可以根据模型求出对应概率,把这个概率和阈值比较,
小于阈值的概率就是异常。这个阈值可以用交叉验证法得到。具体就是1000个正常数据分为600个训练数据,200个正常数据和异常数据组成验证集,
另外200正常数据和10个异常数据构成测试集。阈值是通过多次尝试,人工得到的。
******************不重要东西******************
算法实现:对于每一个特征值,计算他的平均值和方差,得到一个概率密度函数,对于新的特征,
通过概率密度函数计算他的概率分布,小于就是异常,大于就是正常。
异常检测假设特征符合高斯分布,如果数据的分布不是高斯分布,异常检测算法也能够
工作,但是最好还是将数据转换成高斯分布,例如使用对数函数: