- 博客(1)
- 收藏
- 关注
原创 Robertamodel
Robertmodel (robustly Bert Model)其实就是加强版的bertmodel 具体只有以下几点的改变 1:pretraining 得数据从普通bert模型的16g 变成了160g 2.去除掉了nsp,也就是不做next sentence prediction 3.使用的动态mask,普通bert用的是静态mask, 区别就是静态mask,对于一个句子,mask掉部分词,塞进模型,训练完后,就换下一 句,而动态mask会多重复几次,每次都mask掉不同的词 4.training
2020-06-16 11:20:39
943
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅