交叉验证和数据集分割

最新推荐文章于 2023-01-08 11:06:52 发布

入门弟弟梦呓君

最新推荐文章于 2023-01-08 11:06:52 发布

阅读量924

点赞数

分类专栏：自学记录

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41682780/article/details/88542697

版权

自学记录专栏收录该内容

36 篇文章 2 订阅

订阅专栏

在实际的机器学习操作中，经常使用交叉验证操作，即将数据集分为训练集与测试集，再将训练集进行分割，例如，分割为三份，其中一与二建模，用三来验证效果。一三建模用二来验证效果。二三建模用一来验证效果。就这样，可以减少离群点产生的影响，时间里的模型更为有效。
而Python有专门的函数进行分割。

from sklearn.cross_validation import train_test_split

引入包中的train_test_split函数。

X_train, X_test, y_train, y_test = train_test_split(X,y,test_size = 0.3, random_state = 0)

共有四个返回值X_train；X_test；y_train；y_test。其中X，y为需要分割的变量，test_size = 0.3表示分割的比例，random_state=0 表示每次随机的结果都是一样的。

入门弟弟梦呓君

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
交叉验证和数据集分割

在实际的机器学习操作中，经常使用交叉验证操作，即将数据集分为训练集与测试集，再将训练集进行分割，例如，分割为三份，其中一与二建模，用三来验证效果。一三建模用二来验证效果。二三建模用一来验证效果。就这样，可以减少离群点产生的影响，时间里的模型更为有效。而Python有专门的函数进行分割。from sklearn.cross_validation import train_test_split...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。