3-3 理论课预训练语言模型及应用

在这里插入图片描述
语言理解的四个粒度,字段理解、词的理解、句子的理解、篇章的理解
在这里插入图片描述
词向量,词的粒度
在这里插入图片描述
token类别还是整个句子的类别
在这里插入图片描述
词向量是静止的
在这里插入图片描述
预训练语言模型
在这里插入图片描述
底层特征可以复用
在这里插入图片描述
NLP技术发展
在这里插入图片描述
基于双向LSTM ELMO第一个预训练语言模型
在这里插入图片描述
横向左右双向建模得到上下文信息,纵向得到不同程度的特征信息
在这里插入图片描述
不直接参与模型训练,只是作为特征参与下游任务
在这里插入图片描述
解决了一词多义的问题
在这里插入图片描述
问题
在这里插入图片描述
GPT
在这里插入图片描述
更强的文本特征提取能力
在这里插入图片描述
直接参与下游的模型训练
在这里插入图片描述
针对下游任务的应用简化了模型结构设计
在这里插入图片描述
存在缺点
在这里插入图片描述
在这里插入图片描述
直接进行交互式语言训练
在这里插入图片描述
model-based效果更好
在这里插入图片描述
BERT模型的缺点
在这里插入图片描述
ernie基于全局实体信息的mask

在这里插入图片描述
在这里插入图片描述
ERNIE直接触发了BERT-wwm和spanBERT的诞生
在这里插入图片描述
ERNIE也不是最完美的,可以在预训练阶段构造多个任务进行充分训练
在这里插入图片描述
出现了ERNIE2.0,各个模型交替训练先训练A任务,再训练B任务,在一起训练A+B任务
在这里插入图片描述

预训练语言模型的发展
在这里插入图片描述
预训练语言模型的优势
在这里插入图片描述
NLP难点和发展过程
在这里插入图片描述
双塔结构
在这里插入图片描述
单塔结构

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值