BERT（一）—— BERT transformer attention 详解

最新推荐文章于 2022-06-23 15:41:06 发布

微知girl

最新推荐文章于 2022-06-23 15:41:06 发布

阅读量359

点赞数

分类专栏：深度学习 NLP # 预训练模型文章标签：深度学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/katrina1rani/article/details/108759047

版权

NLP 同时被 3 个专栏收录

50 篇文章 13 订阅

订阅专栏

23 篇文章 2 订阅

订阅专栏

预训练模型

6 篇文章 0 订阅

订阅专栏

本文汇总了多个关于BERT模型的详细资源，包括BERT的原理、问题整理、注意力机制的探讨以及在机器阅读理解（MRC）中的应用。深入介绍了BERT的预训练模型演进过程，同时探讨了模型的两个主要损失函数：Masked Language Model和Next Sentence Prediction。此外，还涉及了负对数似然损失函数在分类任务中的作用。

摘要由CSDN通过智能技术生成

先贴链接，后续有时间整理....

参考链接：

https://blog.csdn.net/jiaowoshouzi/article/details/89073944 BERT原理，说的很清楚，直接往后看

BERT模型的若干问题整理记录 & 思考

如何评价 BERT 模型？

transformer问题整理（参考知乎大佬内容）

attention https://zhuanlan.zhihu.com/p/43493999

https://zhuanlan.zhihu.com/p/27769667 attention 代码

https://www.zhihu.com/question/68482809 attention 原理
https://zhuanlan.zhihu.com/p/31547842 √
https://zhuanlan.zhihu.com/p/53682800 attention +transformer

BERT bert 发展史 https://blog.csdn.net/jiaowoshouzi/article/details/89073944

https://www.cnblogs.com/huangyc/p/9898852.html bert 原理 https://blog.csdn.net/u012526436/article/details/87637150

https://www.jianshu.com/p/63943ffe2bab Bert需要理解的一些内容

http://blog.itpub.net/69942346/viewspace-2658642/ BERT 预训练模型演进过程

attention： https://zhuanlan.zhihu.com/p/150294471 https://www.zhihu.com/question/68482809 https://blog.csdn.net/guofei_fly/article/details/105516732

soft attention、hard attention、 local attention结构

BERT_MRC https://blog.csdn.net/eagleuniversityeye/article/details/109601547

损失函数

BERT 官方代码中的分类模型的损失函数叫做负对数似然函数（且是最小化，等价于最大化对数似然函数），数学表达式是：

至于为何要定义这样的损失函数，则是因为在实际使用中，常用逻辑回归模型去解决分类问题，当逻辑回归撞上平方损失，损失函数关于参数非凸。所以，不是分类问题中不使用平方损失，而是逻辑回归不使用平方损失。而代码中的 log_probs 使用了对数，故而不使用平方损失，而使用负对数似然损失函数参考link

模型有两个 loss，一个是 Masked Language Model，另一个是 Next Sentence Prediction

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

微知girl 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。