实践步骤:
1.分别加载训练集和测试集
2.查看一下数据的整体分布,看一下数据的各个统计指标,例如方差、均值等
3.查看数据缺失情况,然后需要对数据缺失值进行填充
4.查看数据是否有异常值,如果有需要怎么处理
5.查看数值型和类别型变量的分布情况
6.对数字特征进行处理,防止有共线性的存在
7.使用pandas profiling生成数据报告
二手车价格预测 数据探索笔记2
最新推荐文章于 2023-05-04 11:45:49 发布
实践步骤:
1.分别加载训练集和测试集
2.查看一下数据的整体分布,看一下数据的各个统计指标,例如方差、均值等
3.查看数据缺失情况,然后需要对数据缺失值进行填充
4.查看数据是否有异常值,如果有需要怎么处理
5.查看数值型和类别型变量的分布情况
6.对数字特征进行处理,防止有共线性的存在
7.使用pandas profiling生成数据报告