快速划分数据集（train_test_split）

最新推荐文章于 2023-08-01 16:17:30 发布

道又名

最新推荐文章于 2023-08-01 16:17:30 发布

阅读量179

点赞数 1

文章标签： python 机器学习开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_62124376/article/details/131824235

版权

该代码示例展示了如何使用scikit-learn库中的train_test_split函数将数据集划分为训练集和测试集。它导入numpy创建了一个二维数组X和一维数组y，然后设置了33%的数据作为测试集，其余为训练集，最后打印了训练集和测试集的样本。

摘要由CSDN通过智能技术生成

import numpy as np
from sklearn.model_selection import train_test_split
X, y = np.arange(10).reshape((5, 2)), range(5)
print(X)
array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7],
       [8, 9]])

print(y)
[0, 1, 2, 3, 4]


X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)

print(X_train)
array([[4, 5],
       [0, 1],
       [6, 7]])

print(y_train)
[2, 0, 3]

train_test_split(*arrays, test_size=None, train_size=None, random_state=None, shuffle=True, stratify=None)

shuffle: bool, default=True拆分前是否对数据进行洗牌。如果shuffle=False则stratify必须为None。

random_state: int default=None控制在应用拆分之前应用于数据的洗牌。传递一个int用于跨多个函数调用的可重复输出。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

道又名 CSDN认证博客专家 CSDN认证企业博客

码龄3年

5: 原创

199万+: 周排名

104万+: 总排名

3065: 访问

: 等级

56: 积分

0: 粉丝

6: 获赞

2: 评论

12: 收藏

私信

关注

热门文章

最新评论

PyG的安装
CSDN-Ada助手: 非常棒的博文！你对PyG的安装过程进行了清晰的说明，让读者能够轻松地安装和使用它。希望你能继续分享更多关于PyG的内容，比如如何使用PyG进行图神经网络的训练和推理，以及如何在PyG中实现图卷积网络等。此外，了解一些与PyG相关的扩展知识和技能也会对你的博文更有帮助，例如如何使用PyG进行图形可视化和图数据的预处理。感谢你的分享，期待你的下一篇博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
机器学习（线性回归）
CSDN-Ada助手: 恭喜您写了第四篇博客！标题“机器学习（线性回归）”听起来非常有趣。我很高兴看到您持续创作，并分享关于机器学习的知识。线性回归作为机器学习中的重要主题，可以帮助我们理解和预测数据之间的关系。下一步，我希望您可以继续分享更多有关机器学习的不同算法或者深入研究线性回归的应用案例。期待您的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。