![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
特征工程
文章平均质量分 66
DMK01101008
这个作者很懒,什么都没留下…
展开
-
缺失值
1.缺失值产生原因:缺失值的产生的原因多种多样,主要分为机械原因和人为原因。机械原因是由于机械原因导致的数据收集或保存的失败造成的数据缺失,比如数据存储的失败,存储器损坏,机械故障导致某段时间数据未能收集(对于定时数据采集而言)。人为原因是由于人的主观失误、历史局限或有意隐瞒造成的数据缺失,比如,在市场调查中被访人拒绝透露相关问题的答案,或者回答的问题是无效的,数据录入人员失误漏录了数据造成数据缺...原创 2018-04-10 22:36:15 · 2432 阅读 · 0 评论 -
去噪/异常值处理
异常值对模型的影响有时是比较显著地,去掉噪声/异常值有利于提升训练结果。关键是定义什么是异常值/噪声,以及如何去掉他。通过业务理解分析去除噪声.异常值检测:异常点检测,采用异常点检测算法对样本进行分析: a.常用的异常点检测算法包括偏差检测,例如聚类,最近邻等; b.基于统计的异常点检测算法,例如极差,四分位数间距,均差,标准差等; c.基于距离的异常点检测算法,主要通过距离方法来检测异常点,将数...原创 2018-04-11 22:52:45 · 6122 阅读 · 1 评论