【Python机器学习】使用scikit-learn中train_test_split函数实现对模型的训练

最新推荐文章于 2023-12-05 22:06:42 发布

rliu2002

最新推荐文章于 2023-12-05 22:06:42 发布

阅读量1.8k

点赞数

分类专栏： Python 文章标签： python 机器学习 scikit-learn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zgsdlr/article/details/123085434

版权

Python 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

训练模型——train_test_split函数实现

scikit-learn中的train_test_split函数可以打乱数据集并进行拆分。这个函数将75%的行数据及对应标签作为训练集，剩下25%的数据及其标签作为测试集。

scikit-learn中的数据通常用大写的X表示，标签用小写的y表示。大写的X是因为数据是一个二维数组（矩阵），用小写的y是因为目标是一个一维数组（向量）

使用步骤

1.导包

from sklearn.model_selection import train_test_split

2.调train_test_split函数

# train_test_split函数的输出为X_train、X_test、y_train和y_test，它们都是NumPy数组
X_train, X_test, y_train, y_test = train_test_split(train_data,train_target,test_size, random_state=0,stratify)

#train_data指定训练集，train_target表示划分的样本结果，test_size表示测试样本占比（如果是整数表示样本的数量），stratify指定训练集不同类别间的分配比例（保持split前类的分布）处理不平衡数据，random_state是随机数的种子（对数据进行拆分之前，train_test_split函数利用伪随机数生成器将数据集打乱。为了确保多次运行同一函数能够得到相同的输出，设置random_state=0再运行一次，结果同上次相同）

train_test_spilt函数实例：https://www.cnblogs.com/Yanjy-OnlyOne/p/11288098.html

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【Python机器学习】使用scikit-learn中train_test_split函数实现对模型的训练

使用scikit-learn中train_test_split函数构建并训练模型
复制链接

扫一扫

专栏目录

rliu2002 CSDN认证博客专家 CSDN认证企业博客

码龄6年

44: 原创

10万+: 周排名

20万+: 总排名

9万+: 访问

: 等级

526: 积分

40: 粉丝

61: 获赞

11: 评论

278: 收藏

私信

关注

热门文章

分类专栏

C++ 25篇
Python 3篇
Java 14篇

最新评论

【数据结构】最短路径问题之Dijkstra算法
rliu2002: 模拟算法思想，可以在原来代码基础上加vis数组，标记是否加入到S中。找到中转点后，应及时修改vis标记。此外，对dis数组应使用fill函数初始化不联通点为inf（10e9），源点到自己距离为0
【数据结构】最短路径问题之Floyd算法
rliu2002: 简言之，佛洛依德算法是在任意两点之间的插点，从中转距离和直连距离中取最小值
【数据结构】最短路径问题之Dijkstra算法
rliu2002: 一句话总结，Dijkstra算法就是从源点直连距离和间接可达距离中去最小值，作为源点到终点的路径距离。初始化距离数组时，不可达赋INF值，自己到自己赋0值。寻找源点的最短距离邻接点从非0距离中找
【Java】将String转换为char的两种方法
m0_68083412: 太棒了，非常感谢
【数据结构】排序算法
rliu2002: 文章提到的排序算法都是基于顺序结构数组存储的数据来说的

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。