3-3 理论课预训练语言模型及应用

最新推荐文章于 2024-08-07 20:37:50 发布

愚昧之山绝望之谷开悟之坡

最新推荐文章于 2024-08-07 20:37:50 发布

阅读量174

点赞数

分类专栏：基于深度学习的自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_15821487/article/details/119485512

版权

基于深度学习的自然语言处理专栏收录该内容

28 篇文章 4 订阅

订阅专栏

在这里插入图片描述
语言理解的四个粒度，字段理解、词的理解、句子的理解、篇章的理解

词向量，词的粒度

token类别还是整个句子的类别

词向量是静止的

预训练语言模型

底层特征可以复用

NLP技术发展

基于双向LSTM ELMO第一个预训练语言模型
在这里插入图片描述
横向左右双向建模得到上下文信息，纵向得到不同程度的特征信息

不直接参与模型训练，只是作为特征参与下游任务

解决了一词多义的问题

问题

GPT

更强的文本特征提取能力

直接参与下游的模型训练
在这里插入图片描述
针对下游任务的应用简化了模型结构设计

存在缺点

直接进行交互式语言训练

model-based效果更好

BERT模型的缺点

ernie基于全局实体信息的mask

在这里插入图片描述

ERNIE直接触发了BERT-wwm和spanBERT的诞生

ERNIE也不是最完美的，可以在预训练阶段构造多个任务进行充分训练

出现了ERNIE2.0，各个模型交替训练先训练A任务，再训练B任务，在一起训练A+B任务

预训练语言模型的发展
在这里插入图片描述
预训练语言模型的优势

NLP难点和发展过程

双塔结构

单塔结构

愚昧之山绝望之谷开悟之坡

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。