当数据集的batch size不能整除数据集大小时,最后那个剩下的batch size就会与设置的数值不同。
我的训练集是2000,验证集200,除以batch size,在训练集上每个小前向是规整的16大小的batch size。但是验证集上200%16=8
,所以,会导致带有batch size维度的einsum报错。(因为另一个输入我给他定死了16的维度)
当数据集的batch size不能整除数据集大小时,最后那个剩下的batch size就会与设置的数值不同。
我的训练集是2000,验证集200,除以batch size,在训练集上每个小前向是规整的16大小的batch size。但是验证集上200%16=8
,所以,会导致带有batch size维度的einsum报错。(因为另一个输入我给他定死了16的维度)