最近在看机器学习的东西时发现了一些特别好玩的东西,机器学习中又分为训练集和测试集,如何把一组很大的数据分为这两个集合呢?可以使用接下来的函数完成:
当然由于random这个随机数生成函数每次产生的数不一定都是刚好达到你的期望,所以总会有一点小小的误差。例如阈值为0.5两个数组的数量却不是一样的:
但对于一个很大的数据集来说,这点误差可以忽略。
将一组很大的数据集随机分成两组数据
最新推荐文章于 2021-07-14 09:47:50 发布
最近在看机器学习的东西时发现了一些特别好玩的东西,机器学习中又分为训练集和测试集,如何把一组很大的数据分为这两个集合呢?可以使用接下来的函数完成:
当然由于random这个随机数生成函数每次产生的数不一定都是刚好达到你的期望,所以总会有一点小小的误差。例如阈值为0.5两个数组的数量却不是一样的:
但对于一个很大的数据集来说,这点误差可以忽略。