数据挖掘中的离群点检测

离群点定义为与普通数据对象显著不同的数据对象,常见于异常行为或错误。离群点检测应用于欺诈检测、风险分析、异常反应识别等领域。常用方法包括基于统计模型、距离度量和聚类分析。统计方法有坚实的理论基础但可能不适合高维或混合类型数据;基于距离的方法考虑对象与邻域密度;基于聚类的方法则通过聚类结构识别离群点,适用于大规模数据集。
摘要由CSDN通过智能技术生成

离群点的定义:离群点是一个数据对象,它显著不同于其他数据对象,好像它是被不同的机制产生一样。

离群点的来源:

(1)客体的异常行为导致,如欺诈、入侵、不寻常的实验结果

(2)数据测量和收集误差
(3)数据变量内在特性引起,如顾客新的购买模式、基因突变等

离群点检测的必要性:

(1)去除某些异常数据

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值