论文笔记：BERT

foreverbeginnerz

已于 2023-01-17 20:44:07 修改

阅读量157

点赞数 1

分类专栏：论文笔记 NLP 文章标签：论文阅读 bert 深度学习

于 2022-12-22 08:55:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2201_75664784/article/details/128403976

版权

一、这篇论文解决的问题

预训练模型

预训练的好处：可以利用大量的无标注数据

两种预训练的策略：

基于特征：预训练好的表示，作为额外的特征输入
基于微调：预训练好的模型，修改最后一层，然后直接在相应数据集上进行训练

相关工作的不足：

GPT：单向
ELMo：基于特征的预训练；没有用transformer

本文的核心：

transformer编码器
双向
MLM + NSP
基于微调

二、模型本身的要点

参数计算

嵌入层：30K x H

注意力部分：L个头

Q、K、V：H x H x 3
输出：H x H
全连接1: H x 4H
全连接2: 4H x H

参数总量 = 30K x H + L x 12 x H x H

输入的表示

原始输入：[CLS] + 句子1 + [SEP] + 句子2

输入层最后的embedding = token embedding(词元和CLS、SEP) + segment embedding(区分SEP前后的句子) + position embedding(位置)

最低0.47元/天解锁文章

foreverbeginnerz

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
论文笔记：BERT

在GPT、ELMo工作的基础上，BERT提出了新的预训练模型的思路
复制链接

扫一扫

专栏目录

foreverbeginnerz CSDN认证博客专家 CSDN认证企业博客

码龄2年

10: 原创

130万+: 周排名

127万+: 总排名

1748: 访问

: 等级

107: 积分

81: 粉丝

5: 获赞

7: 评论

3: 收藏

私信

关注

热门文章

分类专栏

读书笔记 4篇
NLP 2篇
论文笔记 6篇

最新评论

论文笔记：Transformer
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文笔记：BERT
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文笔记：Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)使用标准目录。
论文笔记：Learning Deep Features for Discriminative Localization
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用标准目录。
论文笔记：Visualizing and Understanding Convolutional Networks
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34 给我们提。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。