在做机器学习的任务时,需要在运行模型之前将特征转化成词id再转化成模型可识别的二进制文件形式,其中转化成的词id文件最好进行shuffle,打乱各行数据,这样参数能不易陷入局部最优,模型能够更容易达到收敛。