no_create_entry参数的作用
建议使用的dev集和test集可以设这个参数。这个参数的作用是指定某个集合中的词如果没出现在预训练 embedding 中,会随机 embedding 还是设为 。
https://www.cnblogs.com/TABball/p/12727326.html
这个博客写的很好,举了例子。
不过有一个笔误:
原文:“这样做的好处在于一些词没有在与训练的 embedding 中,但是在test集中出现,我们通过 finetune 可以提高对这个词的理解。若test集或dev集中有这个词,可以达到更好的训练效果。如果test或dev集有只在这两个集合中出现,且没有在预训练出现的词,则按照处理。”
问题:“但是在test集中出现”
修改:“但是在train集中出现”
no_create_entry参数用于指定当集合中的词不在预训练embedding中时的行为,可以设置为随机初始化或忽略。该参数对于dev集和test集尤其重要,因为如果训练集中未出现的词在测试集中出现,微调可以改善模型对这些词的理解。文章指出,如果test或dev集独有的词在预训练中不存在,将按设定方式处理。
370

被折叠的 条评论
为什么被折叠?



