介绍
异常检测是机器学习的一个常用应用,主要针对非监督学习问题。
比如:
* 飞机引擎制造商,采集生产的引擎的各个特征,通过异常检测算法来鉴定引擎有异常的概率。
* 信用卡欺诈账户检测
* 服务器集群,异常节点监测。
高斯分布
俗称:正态分布。
两个参数定义一个分布:
1. 均值μ
2. 方差σ^2
图形:
μ决定中心位置,σ决定波峰宽度。y轴为x取某值的概率。
公式:
算法
利用上面提到的例子,假设我们在做飞机引擎的异常检测。引擎有m个特征X。
每个特征服从各自的高斯分布,结果概率P为:每个特征在其服从的高斯分布中的概率p(i)的乘积。
为P设定边界,超过边界的主体定义为异常主体。