c++2015-2019存在异常_《图解机器学习》局部异常因子与支持向量机异常检测

在实际情况中,输入样本不免存在异常,这对学习过程是十分不利的,减缓这个问题的方法分两种,一种是在学习前就检测出异常并剔除,另一种是提高学习方法的鲁棒性(啊哈哈哈,这么奇怪的字眼,就是抗干扰能力,方法有l1,l2约束等等)

异常检测篇

1.局部异常因子

计算每一个样本的密度比上它邻近k个样本的密度的平均值

具体算法:

异常点/离群点检测算法--LOF - wangyibo0201的博客 - CSDN博客​blog.csdn.net
300bc1fe2bcaaad2141fad6e134e7622.png

代码:

e5e7137351a5f2df59561286ffae85de.png

评价:基于近邻密度的比较来找出离群点,但近邻K难以确定

事先规定的规则可能与用户的期望不相符

算法第一步需要算出所有样本距离,若样本n较大,计算负荷相应增加

2.支持向量机异常检测。

求出一个几乎包含所有训练样本的超球,没有包含在球中的样本被看做异常值

so如何求球心和半径变得很明确(球要包含大部分的样本)

516f10f21a44cc0ecd3dfa3a467ae017.png

通过转化为拉格朗日对偶问题,,。

5669f262f98f415f1d19309c262dcaa4.png求偏导为0

求偏导为0,转为2次规划问题求a

7554eb3ad58fd79aaac07d3c4d06bf58.png

最后得出结论

a9c63bff31b3a3dd3da9a004201055d6.png

评价:正则化参数C比较难选择

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值