Python打乱数据集

最新推荐文章于 2024-04-07 14:08:18 发布

河马小白

最新推荐文章于 2024-04-07 14:08:18 发布

阅读量600

点赞数

分类专栏：深度学习文章标签： python 深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_47104322/article/details/130534875

版权

深度学习专栏收录该内容

6 篇文章 1 订阅

订阅专栏

该文介绍了如何在Python中使用random库打乱数据索引，确保随机划分训练集和测试集时，种子seed能生效。首先通过random.seed设定随机数生成的起点，然后对数据索引进行shuffle，再按比例截取数据形成70%的训练集和30%的测试集。

摘要由CSDN通过智能技术生成

在随机划分训练集和测试集时，需要随机划分，使用这种方法：

一、打乱索引

   import random
   random.seed(seed)
   index = [i for i in range(len(x_train))]
   random.shuffle(index)
   x_train = x_train[index]
   y_train = y_train[index]

注意，第四行不能写成：

   np.random.shuffle(index)

否则seed的设置将失效，每一次运行都是随机的一个数。。。
Python入门篇之random库
 参照这个帖子

二、划分数据集

    # 并截取70%
    len_test = int(0.7 * data.shape[0])  
    # 训练集
    x_train = x_train[:len_test]
    y_train = y_train[:len_test]
    # 测试集
    x_test = x_train[len_test:]  
    y_test = y_train[len_test:]

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

河马小白 CSDN认证博客专家 CSDN认证企业博客

码龄4年

74: 原创

24万+: 周排名

2万+: 总排名

10万+: 访问

: 等级

920: 积分

90: 粉丝

171: 获赞

43: 评论

541: 收藏

私信

关注

热门文章

分类专栏

GAN 3篇
深度学习 6篇
QT 1篇
课程学习 1篇
小样本学习 1篇
stm32 4篇
ubuntu 5篇
opencv 2篇
LINUX 7篇
ROS 12篇
slam 2篇
gazebo 4篇
机器学习 1篇
编程基础 6篇
webots 1篇
matlab 2篇
电机 2篇

最新评论

读取xml的内容并显示在textEdit中，导出xml文件
泡芙萝莉酱: 博主的这篇文章真是让我眼前一亮！对于读取xml的内容并显示在textEdit中，导出xml文件这一主题，博主深入浅出地进行了详细讲解，让我对这个话题有了更加全面的认识。文章中的细节描写十分到位，让我仿佛身临其境，感受到了博主的专业功底和丰富经验。希望博主未来能够继续分享更多高质量的文章，也期待能够得到博主的指导和启发，共同进步成长。再次感谢博主的无私奉献和支持！
gazebo打不开或者无响应？
+～: 你是我的神
catkin_make报错的解决方法汇总
Nanbowangwnag: 就是在终端运行sudo rm -rf /usr/bin/python和 sudo ln -s /usr/bin/python2.7 /usr/bin/python这两行代码
高翔视觉SLAM14讲-学习笔记
我真的一滴也没有: 谢谢
catkin_make报错的解决方法汇总
Young行云流水: 可以详细讲解一些吗大神

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

河马小白 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。