李宏毅《Deep Learning》学习笔记 - BERT and GPT

最新推荐文章于 2024-04-05 19:52:27 发布

dupei

最新推荐文章于 2024-04-05 19:52:27 发布

阅读量366

点赞数

分类专栏：深度学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dupei/article/details/106696869

版权

这篇博客主要介绍了深度学习在自然语言处理中的应用，重点讲解了BERT和GPT模型。BERT通过Masked LM和Next Sentence Prediction进行训练，能够理解和处理上下文语境。而GPT则是另一种序列生成模型，原理和应用也进行了简要说明。

摘要由CSDN通过智能技术生成

学习资料：video, PPT

1. 背景

BERT的本质就是transformer encoder

为什么会出现BERT呢？这就需要从NLP最初的问题说起，我们需要对语句中的word做编码。最初的编码方式是1-of-N encoding（one-hot），但是，这样的编码方式有两个严重的问题：（1）编码过于稀疏；（2）无法区分类别。为了解决类别区分的问题，所以，需要对word做分类，名词、动词、动物、植物等等。再后来，就有了经典的word embedding。
在这里插入图片描述
然而，word embedding也有其局限性。不同语境下，相同的词，表达的意思会有差异。如下面两个例子。

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
李宏毅《Deep Learning》学习笔记 - BERT and GPT

视频：https://www.youtube.com/watch?v=UYPa347-DdE&list=PLJV_el3uVTsOK_ZK5L0Iv_EQoL1JefRL4&index=61课件：http://speech.ee.ntu.edu.tw/~tlkagk/courses/ML_2019/Lecture/BERT%20(v3).pdf
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。