1、提高训练的token长度,将训练语料的句子进行拼接,从而学习到更多的语义信息,输入的token长度大概为500左右(bert要求小于512)。 2、保证训练的token长度和测试的token长度大致相同,提高模型在测试集上的准确率。