1、提高训练的token长度,将训练语料的句子进行拼接,从而学习到更多的语义信息,输入的token长度大概为500左右(bert要求小于512)。
2、保证训练的token长度和测试的token长度大致相同,提高模型在测试集上的准确率。
增加输入的token长度
最新推荐文章于 2024-02-07 22:17:17 发布
1、提高训练的token长度,将训练语料的句子进行拼接,从而学习到更多的语义信息,输入的token长度大概为500左右(bert要求小于512)。
2、保证训练的token长度和测试的token长度大致相同,提高模型在测试集上的准确率。