Anomaly Detection
设计一个函数能判断 x x x是否与训练集{ x 1 , . . . , x T x^1,...,x^T x1,...,xT}中的训练数据相似。是一个二元分类问题。
应用
1.欺诈检测(Fraud Detection)。
2.网络系统入侵检测(Network Instrusion Detection)。
3.癌细胞检测(Cancer Detection)。
分类器信心分数(y值)做异常检测
训练数据有标记。
f
(
x
)
=
{
a
n
o
m
a
l
y
,
c
(
x
)
≤
λ
n
o
r
m
a
l
,
c
(
x
)
>
λ
f(x)=\{^{normal,c(x)>\lambda}_{anomaly,c(x)\leq\lambda}
f(x)={anomaly,c(x)≤λnormal,c(x)>λ
λ
:
\lambda:
λ:阈值
f : f: f:上一讲中的概率分布函数,可以求概率。
存在的问题:有些异常数据具有很明显的正常数据的特征。
解决方法:生成一些异常数据,训练分类器给较低的信心分数。