数据挖掘
文章平均质量分 93
wangyibo0201
这个作者很懒,什么都没留下…
展开
-
异常点/离群点检测算法——LOF
局部异常因子算法-Local Outlier Factor(LOF) 在数据挖掘方面,经常需要在做特征工程和模型训练之前对数据进行清洗,剔除无效数据和异常数据。异常检测也是数据挖掘的一个方向,用于反作弊、伪基站、金融诈骗等领域。 异常检测方法,针对不同的数据形式,有不同的实现方法。常用的有基于分布的方法,在上、下α分为点之外的值认为是异常值(例如图1),对于属性值常用此类方法。基于距离的方法原创 2016-06-18 15:18:21 · 172720 阅读 · 52 评论 -
模块度Q——复杂网络社区划分评价标准
对复杂网络进行社区划分,需要有一些评价指标,来评判算法对网络划分结果的好坏优劣。如果我们预先知道网络的真实划分结果,那么我们可以用NMI(归一化互信息)去衡量算法划分结果和真实结果的重合程度,这个会在以后的文章中具体介绍。大多数情况下,我们是不知道网络的真实划分的,尤其是对于大型网络来说更是如此,复杂网络的命名明确的说明了这种现实情况。但是我们依然有方法可以量化或评判我们的社区划分水平,也就是今天要原创 2016-07-27 18:35:25 · 61431 阅读 · 41 评论