train_test_split、cross_val_score与GridSearchCV的区别、联系与应用

最新推荐文章于 2023-10-01 15:49:56 发布

m0_75173985

最新推荐文章于 2023-10-01 15:49:56 发布

阅读量284

点赞数 1

文章标签：机器学习人工智能 python 算法数据结构

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_75173985/article/details/132321493

版权

今天在优化模型的时候碰到了一件头疼的事：

train_test_split、cross_val_score与GridSearchCV貌似是三个非常相近的概念，它们都包含交叉验证的相关知识。在我查询的相关案例中三者也都有相应的出现，但比较杂乱，此处对此尽量做出一个我个人的理解和思考。

1、train_test_split（简单交叉验证）

首先要明确交叉验证的概念和目标。

交叉验证是在机器学习建立模型和验证模型参数时常用的办法，一般被用于评估一个机器学习模型的表现。更多的情况下，我们也用交叉验证来进行模型选择(model selection)。

交叉验证用在数据不是很充足的时候。如果数据样本量小于一万条，我们就会采用交叉验证来训练优化选择模型。如果样本大于一万条的话，我们一般随机的把数据分成三份，一份为训练集（Training Set），一份为验证集（Validation Set），最后一份为测试集（Test Set）。用训练集来训练模型，用验证集来评估模型预测的好坏和选择模型及其对应的参数。把最终得到的模型再用于测试集，最终决定使用哪个模型以及对应参数。

在划分该三部分的数据时，都可以使用train_test_split
sklearn.model_selection.train_test_split(*arrays, **options)
train_data：所要划分的样本特征集
train_target࿱

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

博客等级

码龄2年

2
原创

1
点赞

3
收藏

0
粉丝

关注

私信

热门文章

最新评论

train_test_split、cross_val_score与GridSearchCV的区别、联系与应用
CSDN-Ada助手: 非常鼓励你持续创作博客！你对train_test_split、cross_val_score和GridSearchCV的区别和联系做出了很好的总结。这些工具都与交叉验证有关，但在具体用法和应用上有一些区别。除了这些在标题和摘要中提到的内容，你还可以继续探索以下扩展知识和技能： 1. 模型评估指标：除了交叉验证外，你可以介绍一些常用的模型评估指标，比如准确率、召回率、F1值等。这些指标可以帮助我们更好地评估模型的性能。 2. 超参数调优：在模型优化过程中，除了使用交叉验证来评估模型的性能外，你还可以介绍一些常用的超参数调优方法，比如网格搜索(GridSearch)、随机搜索(RandomizedSearch)等。这些方法可以帮助我们找到最佳的模型参数组合。 3. 模型选择：在使用train_test_split、cross_val_score和GridSearchCV时，你可以讨论如何选择适合的模型。可以介绍一些常用的机器学习模型，比如线性回归、决策树、支持向量机等，并讨论它们在不同情况下的优劣势。希望这些扩展知识和技能对你的博客创作有所帮助。继续努力，期待看到更多精彩的内容！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
用户新增预测挑战赛：关于baseline的解读和看法
CSDN-Ada助手: 恭喜您写下了第一篇博客！标题《用户新增预测挑战赛：关于baseline的解读和看法》非常吸引人。通过解读baseline，您为读者提供了有价值的信息和观点。接下来，我建议您可以进一步扩展您的内容，比如探讨baseline的优化方法或者与其他预测挑战赛的对比分析。希望您能继续分享您的见解，期待您的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
用户新增预测挑战赛：关于baseline的解读和看法
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/617038826。

最新文章

用户新增预测挑战赛：关于baseline的解读和看法

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。