- 博客(2)
- 收藏
- 关注
转载 特征工程总结
特征工程之特征选择转自https://www.cnblogs.com/pinard/p/9032759.html特征工程是数据分析中最耗时间和精力的一部分工作,它不像算法和模型那样是确定的步骤,更多是工程上的经验和权衡。因此没有统一的方法。这里只是对一些常用的方法做一个总结。本文关注于特征选择部分。后面还有两篇会关注于特征表达和特征预处理。特征的来源 在做数据分析的时候,特征...
2020-03-28 20:31:36 104
转载 EDA分析-缺失值填充
数据挖掘学习路径缺失值填充转自https://www.cnblogs.com/magle/articles/6110195.html数据缺失机制在对缺失数据进行处理前,了解数据缺失的机制和形式是十分必要的。将数据集中不含缺失值的变量(属性)称为完全变量,数据集中含有缺失值的变量称为不完全变量,Little 和 Rubin定义了以下三种不同的数据缺失机制:1)完全随机缺失(Miss...
2020-03-24 17:37:41 595
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人