model_selection.train_test_split笔记

silence454545

于 2024-03-01 08:28:16 发布

阅读量299

点赞数 2

文章标签：笔记机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/silence454545/article/details/136385724

版权

1. 简介

1.1数据集

以鸢尾花数据集为例

该数据集共150个样本，三种类别鸢尾花，每种50个样本，4个属性（花萼长度，花萼宽度，花瓣长度，花瓣宽度）

1.2 model_selection.train_test_split

train_test_split(*arrays,test_size=None,train_size=None,random_state=None,shuffle=True,stratify=None)

*arrays：数据（由4个属性构成）

test_size：测试集占比（浮点数0~1），也可以是个数（int）

random_state:随机种子，设置后每次可得到相同的分割结果

stratify：根据类别标签分层分割数据

2. 函数的使用

from sklearn import model_selection, datasets
data, labels = datasets.load_iris(return_X_y=True)
x_train,x_test,y_train,y_test= model_selection.train_test_split(data,labels, test_size=0.4,random_state=1234,stratify=labels)
print(y_test)

[1 2 1 2 0 2 0 0 2 2 0 1 1 1 0 2 2 0 0 2 1 0 1 0 1 1 1 1 2 1 1 2 2 0 2 1 2
0 1 0 2 2 0 0 1 0 2 0 2 0 2 2 1 0 1 2 0 1 1 0]

以3：2的比例分割数据集，训练集90个样本，测试集60个样本，设置stratify后测试集内每个类别分别有20个样本；反之，则每个类别不是按比例分割。

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

博客等级

码龄7年

5
原创

9
点赞

1
收藏

7
粉丝

关注

私信

热门文章

最新评论

model_selection.train_test_split笔记
CSDN-Ada助手: 恭喜你写了第三篇博客！看到你对model_selection.train_test_split的笔记，我感觉受益匪浅。希望你可以继续坚持创作，分享更多关于模型选择的知识和经验。或许下一步可以尝试写一些实际案例分析，让读者更直观地理解这些知识。不过我知道这需要花费更多时间和精力，所以只是建议，希望你能继续保持努力和热情！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
KeyError: ‘passes columns are not ALL present dataframe‘
27730: a是什么
KeyError: ‘passes columns are not ALL present dataframe‘
小明miss小黎: 不清楚呀！
数据分析遇到的问题
CSDN-Ada助手: 非常感谢你的分享和思考！你提到的问题确实是数据分析中一个常见的挑战。关于你提到的植物化学成分的分析问题，我认为你可以考虑使用一种叫做多元分析的方法。多元分析可以帮助你比较不同实验组之间化合物含量的差异，并找出质量的变化趋势。此外，你还可以尝试使用统计软件来处理和分析数据，比如R语言或Python中的pandas库。这些工具可以帮助你更好地理解数据并进行更深入的分析。希望我的建议能对你有所帮助，期待看到你更多的博客文章！继续努力创作，你一定会有更多的收获！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
KeyError: ‘passes columns are not ALL present dataframe‘
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。