Task2 二手车交易价格预测 数据探索(EDA)
步骤总结
1. 载入各种数据科学以及可视化库:
数据科学库 pandas、numpy、scipy;
可视化库 matplotlib、seabon、missingno(缺失值可视化)
2. 载入数据并简略观察
3. 数据总览:
describe():查看数据的相关统计量
通过info():了解数据每列的type,有助于了解是否存在除了nan以外的特殊符号异常
4. 判断数据缺失和异常
5.了解预测值的分布
6.特征分为类别特征和数字特征,并对类别特征查看unique分布
数字特征分析
类型特征分析
7. 用pandas_profiling生成数据报告