熟悉了整个学习竞赛的流程,准备运用github进行打卡
重点对赛题开展理解:
数据的探索性分析(EDA)
关于变量信息的选择:原始数据有31列变量,按照我的理解,针对模型开展的训练需要对特征信息进行筛选,也就是对那些对最终价格预测无作用甚至起消极作用的特征列进行删除。
交易ID:应该只是个编号,不重要
Name:汽车交易名称,应该也不重要
RegDate:汽车注册日期,主要是能提供汽车的使用年限
Model:车型编码? 这个要看一下数据分析 看看与价格有没有关联
Brand:汽车品牌,不同品牌价格不同
bodyType:车身类型,车身类型应该有影响
fuelType:燃油类型
gearbox:
power:
kilometer: