- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 去噪/异常值处理
异常值对模型的影响有时是比较显著地,去掉噪声/异常值有利于提升训练结果。关键是定义什么是异常值/噪声,以及如何去掉他。通过业务理解分析去除噪声.异常值检测:异常点检测,采用异常点检测算法对样本进行分析: a.常用的异常点检测算法包括偏差检测,例如聚类,最近邻等; b.基于统计的异常点检测算法,例如极差,四分位数间距,均差,标准差等; c.基于距离的异常点检测算法,主要通过距离方法来检测异常点,将数...
2018-04-11 22:52:45 6167 1
原创 缺失值
1.缺失值产生原因:缺失值的产生的原因多种多样,主要分为机械原因和人为原因。机械原因是由于机械原因导致的数据收集或保存的失败造成的数据缺失,比如数据存储的失败,存储器损坏,机械故障导致某段时间数据未能收集(对于定时数据采集而言)。人为原因是由于人的主观失误、历史局限或有意隐瞒造成的数据缺失,比如,在市场调查中被访人拒绝透露相关问题的答案,或者回答的问题是无效的,数据录入人员失误漏录了数据造成数据缺...
2018-04-10 22:36:15 2465
原创 机器学习相关会议,期刊与博客
会议:NIPS, ICML, UAI, AISTATS; ICCV, CVPR, ECCV;IJCAI, AAAI; 期刊:JMLR, ML, Trends in ML, IEEE T-NN;IEEE T-PAMI, IJCV, IEEE T-IP;博客:MachineLearning - Google Newshttps://news.google.com/news/search/section...
2018-04-10 21:42:15 439
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人