离群点检测
离群点检测是数据挖掘中重要的一部分,它的任务是发现与大部分其他对象显著不同的对象。大部分数据挖掘方法都将这种差异信息视为噪声而丢弃,然而在一些应用中,罕见的数据可能蕴含着更大的研究价值。
离群点检测已经被广泛应用于电信和信用卡的诈骗检测、贷款审批、电子商务、网络入侵、天气预报等领域,如可以利用离群点检测分析运动员的统计数据,以发现异常的运动员。
1) 离群点的成因
离群点的主要成因有:数据来源于不同的类、自然变异、数据测量和收集误差。
2)离群点的类型
对离群点的地址分类如下表所示:
分类标准 |
分类名称 |
分类描述< |