使用shuffle进行打乱数据的问题总结

最新推荐文章于 2022-10-14 19:59:56 发布

少游223

最新推荐文章于 2022-10-14 19:59:56 发布

阅读量3.6k

点赞数

分类专栏：机器学习人工智能文章标签： shuffle

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shaoyou223/article/details/86062309

版权

人工智能同时被 2 个专栏收录

26 篇文章 0 订阅

订阅专栏

25 篇文章 0 订阅

订阅专栏

最近在做xgboost分类的时候需要用到shuffle来打乱数据，但是遇到的问题是数据量太大所造成的当shuffle数据时程序会卡死，所以，我就先把pandas数据进行shuffle，然后再转换成numpy型数据：

pua_data = np.array(shuffle(pua_data))

后来在使用shuffle时用了np中的shuffle，造成的结果就是把数据全丢失了，当时用的是np.random.shuffle函数，用sklearn中的shuffle就可以解决，这个库里的shuffle可以对pandas以及numpy都可以进行操作：

from sklearn.utils import shuffle

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
使用shuffle进行打乱数据的问题总结

最近在做xgboost分类的时候需要用到shuffle来打乱数据，但是遇到的问题是数据量太大所造成的当shuffle数据时程序会卡死，所以，我就先把pandas数据进行shuffle，然后再转换成numpy型数据： pua_data = np.array(shuffle(pua_data))后来在使用shuffle时用了np中的shuffle，造成的结果就是把数据全丢失了，当时用的是...
复制链接

扫一扫

专栏目录

少游223 CSDN认证博客专家 CSDN认证企业博客

码龄7年

93: 原创

6万+: 周排名

162万+: 总排名

27万+: 访问

: 等级

3224: 积分

147: 粉丝

69: 获赞

71: 评论

202: 收藏

私信

关注

热门文章

分类专栏

wenet 5篇
语音识别 5篇
kaldi 3篇
c
机器学习 25篇
mnist 1篇
人工智能 26篇
kaggle 2篇
数据挖掘 14篇
赛码 2篇
pysptk 1篇
安装失败 2篇
数据库 1篇
MYSQL 1篇
autoware 4篇
sprocket 1篇
深度学习 7篇
语音转换 1篇
python 14篇
ubuntu 11篇
算法 6篇
opencv 1篇
c++ 3篇
sh 2篇
系统 7篇
编译 1篇
gi
jupyte 1篇
服务 1篇
x

最新评论

python3中无法import cv2，importError: /opt/ros/kinetic/lib/python2.7/dist-packages/cv2.so
新一代图书管理员の养成笔记: 所以概括就是通过强行sys.path.remove python2.7的库，来逼迫import cv2 搜索py3的库吧
计算mcd值
weixin_43065256: 楼主您好，请问您在最后计算overall mcd 的时候有没有出现这个错误呢Traceback (most recent call last): File "bin/dtw_synth", line 131, in <module> main(sys.argv) File "bin/dtw_synth", line 121, in main synthFullWarped = dtw.warpGeneral(synthFull, synthIndexSeq) File "/usr/local/lib/python2.7/dist-packages/mcd/dtw.py", line 163, in warpGeneral ysWarped = ys[yIndexSeq] IndexError: index 843 is out of bounds for axis 0 with size 843 如果有的话，应该怎么解决呢。我大概看了一下，好像是因为读取的时候ys长度变短了
编译文件时，mkdir build的位置选择
少游223: cmake .. #关键在..上
利用kNN算法对iris数据集进行分类，本人也做了修改使得代码可实现
陈序袁: 请问下如果数据集中样本的特征值个数是4的话应该如何修改呢？
module 'h5py' has no attribute 'File' 解决办法
qq_41861755: AttributeError: module 'h5py' has no attribute 'Dataset'怎么解决

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。