将一组很大的数据集随机分成两组数据

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Arrogant_95/article/details/79976286

最近在看机器学习的东西时发现了一些特别好玩的东西,机器学习中又分为训练集和测试集,如何把一组很大的数据分为这两个集合呢?可以使用接下来的函数完成:
这里写图片描述
当然由于random这个随机数生成函数每次产生的数不一定都是刚好达到你的期望,所以总会有一点小小的误差。例如阈值为0.5两个数组的数量却不是一样的:
这里写图片描述
但对于一个很大的数据集来说,这点误差可以忽略。

阅读更多
想对作者说点什么?

博主推荐

换一批

没有更多推荐了,返回首页