no_create_entry参数的作用
建议使用的dev集和test集可以设这个参数。这个参数的作用是指定某个集合中的词如果没出现在预训练 embedding 中,会随机 embedding 还是设为 。
https://www.cnblogs.com/TABball/p/12727326.html
这个博客写的很好,举了例子。
不过有一个笔误:
原文:“这样做的好处在于一些词没有在与训练的 embedding 中,但是在test集中出现,我们通过 finetune 可以提高对这个词的理解。若test集或dev集中有这个词,可以达到更好的训练效果。如果test或dev集有只在这两个集合中出现,且没有在预训练出现的词,则按照处理。”
问题:“但是在test集中出现”
修改:“但是在train集中出现”