数据挖掘-离群点检测

离群点检测是数据挖掘的关键部分,用于发现与大多数对象显著不同的对象,常见于诈骗检测、贷款审批等领域。离群点可能由于不同类、自然变异或数据误差引起。检测方法包括基于统计、邻近度、密度和聚类。基于模型的检测如一元正态分布可识别异常值,而基于聚类的方法通过评估对象对簇的归属程度来检测离群点。
摘要由CSDN通过智能技术生成

离群点检测 

       离群点检测是数据挖掘中重要的一部分,它的任务是发现与大部分其他对象显著不同的对象。大部分数据挖掘方法都将这种差异信息视为噪声而丢弃,然而在一些应用中,罕见的数据可能蕴含着更大的研究价值。

      离群点检测已经被广泛应用于电信和信用卡的诈骗检测、贷款审批、电子商务、网络入侵、天气预报等领域,如可以利用离群点检测分析运动员的统计数据,以发现异常的运动员。

1)  离群点的成因

离群点的主要成因有:数据来源于不同的类、自然变异、数据测量和收集误差。

2)离群点的类型

  对离群点的地址分类如下表所示:

分类标准

分类名称

分类描述<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值