从源码层面理解Bert模型


前言

本篇讲解的Bert的也是之前看过的内容,现将源码及本人做的思维导图贴出来,希望能帮到有需要的同学。

Bert模型源码思维导图

在这里插入图片描述
Bert的主要结构是基于Transformer模型构造的,所以在看Bert之前,建议先将Transformer模型搞懂,搞懂Transformer之后,那么Bert的理解将不成问题。如有问题,可以参考笔者的上一篇文章“基于模型结构与模型源码两个层面理解Transformer”。

初看Bert源码时,真正难啃的还是训练数据的构造,对照着文末参考文章里的源码,将“数据处理并生成batch”部分看懂,基本上就能从源码上理解整个Bert模型了。

总结

以上就是全部内容了,本文主要贡献就是分享了自己做的思维导图,并没有对Bert模型进行详细解读,是因为笔者相信在理解了Transformer模型之后,Bert的理解将会容易很多。思维导图是基于笔者个人的理解整理而成,如有错误欢迎批评指正。

参考文章:https://wmathor.com/index.php/archives/1457/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值