目录
背景
在分类任务产经下,对数据进行训练时,经常需要对数据进行打乱操作,以防数据学习到label中连续的特征,例如:如果训练数据中打乱前连续100,1000个数据都是label标注为1的数据,那么可能会使得模型在预测时隐含了这种假设,全猜一边就能获得100%的准确率。
random.shuffle(list)解决
使用random.shuffle(list)解决该问题,传入一个list类型的参数,会自动进行打乱,注意这个打乱是在原有的list上直接打乱,没有返回值
目录
在分类任务产经下,对数据进行训练时,经常需要对数据进行打乱操作,以防数据学习到label中连续的特征,例如:如果训练数据中打乱前连续100,1000个数据都是label标注为1的数据,那么可能会使得模型在预测时隐含了这种假设,全猜一边就能获得100%的准确率。
使用random.shuffle(list)解决该问题,传入一个list类型的参数,会自动进行打乱,注意这个打乱是在原有的list上直接打乱,没有返回值