
Data Mining
没有水杯和雨伞的工科男
这个作者很懒,什么都没留下…
展开
-
Data Science--数据预处理
ps,第一章的内容由于是科普性的内容,我就暂且没有对其进行相关概念的整理Chapter 2 数据的预处理数据预处理是指在对数据进行正式处理计算前 ,根据后续计算的需求对原始数据进行审计、清洗、变换2.1 数据质量对数据质量的三个描述:正确性、完整性、一致性2.1.1 统计学规律(1)第一数字定律:表示人们在使用数字的使用具有一定的使用的规律,防止出现编造数据(2)小概...原创 2018-09-14 17:14:50 · 1183 阅读 · 1 评论 -
LOF-Local Outlier Factor
摘要: Local Outlier Factor(LOF)是基于密度的经典算法(Breuning et.al. 2000), 文章发表于 SIGMOD 2000, 到目前已经有 3000+ 的引用。在 LOF 之前的异常检测算法大多是基于统计方法的,或者是借用了一些聚类算法用于异常点的识别(比如 ,DBSCAN,OPTICS)。大神的文章:https://blog.csdn.net/wangy...原创 2018-08-21 22:02:05 · 530 阅读 · 0 评论