文献笔记|【文本表征】BERT

最新推荐文章于 2023-03-14 13:36:30 发布

VIP文章王小小小草

最新推荐文章于 2023-03-14 13:36:30 发布

阅读量4.1k

点赞数 1

分类专栏： AI论文解读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_33761963/article/details/83578498

版权

image_1cr2h562ngbacn4hvn11129j89.png-49.8kB

论文信息：

论文题目：BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
论文发表时间：2018年10月11日
机构：Google AI

简介

文献解决的问题：提出一个语言表征的模型，叫BERT（Bidirectional Encoder Representations from Transformers）
特点：与传统的语言表征模型不同，BERT使用的是深度双向表征，即在每一层中同时基于左边和右边的context来做预测。
优势：预训练的BERT模型只需要在上面增加额外的一层，就能广泛地于多种NLP任务中进行fine-tune.
结果：在11项NLP任务上都取得了state of art的成绩。

模型主体

1 模型结构

BERT是基于Vaswani et al(2017)的论文"Attention is all you need"中提出的transformer模型构建的多层双向transformoer encoder.
(关于"Attention is all you need"该篇文献的介绍可参见https://blog.csdn.net/sinat_33761963/article/de

最低0.47元/天解锁文章

王小小小草

关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
文献笔记|【文本表征】BERT

论文信息：论文题目：BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding论文发表时间：2018年10月11日机构：Google AI简介文献解决的问题：提出一个语言表征的模型，叫BERT（Bidirectional Encoder Representations from Tra...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。