ppt转成图片形式上传的,带来不便尽请谅解。
分享内容如下:
1.Bert概述,介绍Bert是什么,已经2018年发表出来后带来的影响,Bert模型的表现。
2. Transformer模型的回归,介绍self-attention,多头机制,为什么要用多头。
3. Bert模型的改进,和Transformer的Encoder有什么区别。
4. Bert模型结构的介绍,模型输入介绍
5. LN和BN的区别和联系
6. Bert参数量的计算
7. Pre-Train的两个训练方式
8. Fine-Turn的介绍