一 对于赛题理解
- 对于二手交易价格预测问题求解,要明白价格是一个离散序列,因此采用分类问题求。首先在求解分类问题要明白采用什么工具包,以及选择分类算法的评估指标,其次选择合适特征值用于模型的评估,然后在数据集上划分训练集、测试集、验证集,进行测试比较,遇到不合适的再进行调参,使模型达到最优。最后放在线上提交模型,通过排名查看情况,检验自已不足。看看是否还能在提升
二 用代码实现问题,开始应该遵循以及下几个步骤
- 1.要把使用的库载入,方便代用
- 2.读取数据 ,然后把数据划分训练集、测试集(训练集是用于训练模型,测试集是检验模型的取的特征值是否合理)
- 3对数据信息查看,方便统计信息,以及数据信息有个全面了解
- 4.对数据中不合理,改进以及去除
- 5.构建与标签构建,统计标签的基本信息分布,查看数据情况
- 6 对数据进行特征提取
- 7 建模调参
- 8 模型融合