天池-二手车价格预测-Modeling

最新推荐文章于 2022-09-01 06:00:00 发布

磕盐冬

最新推荐文章于 2022-09-01 06:00:00 发布

阅读量305

点赞数

文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34446027/article/details/105255408

版权

接上两篇：天池-二手车价格预测-EDA、天池-二手车价格预测-FE

0.Modeling简介

经过EDA和FE环节，原始数据已经经过相应的处理，此时可以将处理后的数据重新拆分为两个集合：特征集合和目标集合，然后，通过建模用特征预测目标。

1.主要流程

1.1 数据划分

通常，在训练有监督的机器学习模型的时候，会将数据划分为训练集、验证集和测试集，目的是为了能够选出效果最好、泛化最佳的模型。

训练集（Training set）：训练出同一参数不同取值的模型。

验证集(Cross Validation set)：验证训练集训练出的各个模型的效果，得到效果最好的模型的参数。

测试集(Test set)：通过训练集、验证集中不存在的数据对模型泛化能力做出评估。

1.2 模型构建

此次直接使用XGBoost和LightGBM模型，有关详细介绍可以参考：

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
天池-二手车价格预测-Modeling

接上两篇：天池-二手车价格预测-EDA、天池-二手车价格预测-FE0.Modeling简介经过EDA和FE环节，原始数据已经经过相应的处理，此时可以将处理后的数据重新拆分为两个集合：特征集合和目标集合，然后，通过建模用特征预测目标。1.主要流程1.1 数据划分通常，在训练有监督的机器学习模型的时候，会将数据划分为训练集、验证集和测试集，目的是为了能够选出效果最好、泛化最佳的模型。训练...
复制链接

扫一扫

磕盐冬 CSDN认证博客专家 CSDN认证企业博客

码龄8年

17: 原创

78万+: 周排名

135万+: 总排名

5251: 访问

: 等级

193: 积分

4: 粉丝

1: 获赞

1: 评论

3: 收藏

私信

关注

热门文章

最新评论

Datawhale-天池入门赛街景字符编码识别-Task5：模型集成
炼丹术师: 作者你好，请问能提供完整的代码用于学习吗，我不断调参也只能到零点五的正确率

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。