![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
BERT
注意力机制
Kaaaakaki
这个作者很懒,什么都没留下…
展开
-
bert模型
另外,BERT 还有一个至关重要的训练技巧,就是调整学习率。BERT内的参数在 fine-tuning 时,学习率一定要调小,特别时后面还接了别的东西时,一定要按两个学习率走,甚至需要尝试多次反复调,要不然 BERT 很容易就步子迈大了掉沟里爬不上来,个人经验作者:王岳王院长链接:https://zhuanlan.zhihu.com/p/166496466来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。...原创 2021-07-23 14:07:31 · 509 阅读 · 0 评论 -
ner常用数据集
https://zhuanlan.zhihu.com/p/88247160原创 2021-07-23 14:07:14 · 1126 阅读 · 0 评论