将一组很大的数据集随机分成两组数据

最近在看机器学习的东西时发现了一些特别好玩的东西,机器学习中又分为训练集和测试集,如何把一组很大的数据分为这两个集合呢?可以使用接下来的函数完成:
这里写图片描述
当然由于random这个随机数生成函数每次产生的数不一定都是刚好达到你的期望,所以总会有一点小小的误差。例如阈值为0.5两个数组的数量却不是一样的:
这里写图片描述
但对于一个很大的数据集来说,这点误差可以忽略。

阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Arrogant_95/article/details/79976286
个人分类: Python小知识点
上一篇通过公式计算圆周率
下一篇MATLAB实现小波变换去噪
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭