1 问题描述
在进行Dataset的写作时是否需要设置shuffle = True呢?伍老师说这样设置是不利于模型训练的,因为这样batch的数据会有周期性的特点;我个人是不赞同的;
2 Dataset需要使用shuffle——“配合drop_last实现数据遍历”
为了在较小batch时同时保持训练的稳定性,我们使用了drop_last参数,此时我们必须使用shuffle = True
,否则在遍历数据时,由于数据列表的顺序时确定的,则每次drop_last的数据也是确定的,则不足以形成batch的last数据永远无法遍历到;