机器学习入门——以阿里移动推荐算法大赛为例

最新推荐文章于 2022-03-22 10:54:35 发布

光于前裕于后

最新推荐文章于 2022-03-22 10:54:35 发布

阅读量6.1k

点赞数 1

分类专栏：数据挖掘基础知识大数据相关比赛

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Dr_Guo/article/details/51193603

版权

数据挖掘同时被 3 个专栏收录

17 篇文章 1 订阅

订阅专栏

11 篇文章 1 订阅

订阅专栏

大数据相关比赛

5 篇文章 33 订阅

订阅专栏

本文介绍了机器学习中训练集、验证集和测试集的概念及其作用。训练集用于拟合模型参数，验证集用于调整模型结构，如神经网络的隐藏层数量，而测试集则用来评估模型的泛化能力。当样本量较少时，通常采用K折交叉验证法，K取N时称为留一法。注意验证集和测试集的使用不应混淆，且测试集评估后不应再对模型进行调整。

摘要由CSDN通过智能技术生成

如果我说的不对请留言告诉我，谢谢！红字部分来自南京大学周志华教授写的机器学习一书。

赛题在这：天池新人实战赛----阿里移动推荐算法大赛

从数据中学的模型的过程称为“学习”（learning）或“训练”（training），这个过程通过执行某个学习算法来完成，如GBDT。训练过程中使用的数据称为“训练数据”，其中的每个样本称为一个“训练样本”（training sample），训练样本组成的集合称为“训练集”（training set）。

比如阿里移动推荐算法大赛中要求的预测第31天购买情况，可以将前20-29天数据作为训练集，但要训练出模型只有这10天数据是不够的，要建立关于“预测”（prediction

光于前裕于后

关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

光于前裕于后 您的打赏将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。