百度飞桨nlp

最新推荐文章于 2024-07-18 20:18:19 发布

鸝u翾

最新推荐文章于 2024-07-18 20:18:19 发布

阅读量352

点赞数

文章标签：百度 paddlepaddle 自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_63091617/article/details/134517821

版权

1-3 节课总结

语义理解任务介绍

简单来说就是理解一句话的意思

Word2Vec

训练方法

CBOW & Skip-Ngram （2013 年）

CBOW：基于临近词（上下文）预测词
Skip-Ngram：基于词预测临近词（上下文）

利用深度学习的技术

核心：通过embedding层将词转化为对应的向量

如何使用

对训练出的词向量增加下游操作后进行运用
在这里插入图片描述

存在的问题

词向量是静态固定的，无法根据上下文语义调整词向量！
在下游任务中，其余的模型参数仍然需要重新训练 !

Pre-training & Fine-tuning 机制

ELMo : 第一个现代的语义理解模型

• Pre-training 阶段
• 使用Bi-LSTM语言模型建模
• 两层LSTM
• 双向语言模型建模（L - R，R - L）
• 无监督训练，训练数据 1B Word

核心思想：只预训练 language model，而 word embedding 是通过输入的句子实时输出基于上下文的动态 Word Embedding

使用方法：通过对输出线性组合后进行下一个任务

在这里插入图片描述

优点和缺点

优点：解决了多词多意的问题
问题1：不完全双向预训练
模型的前向和后向 LSTM 两个模型是分别训练的，仅在 Loss Function阶段进行了结合。
问题2：需进行任务相关网络结构设计
每种类型的下游任务都需要进行特定的网络结构设计和搭建
问题3：仅有词向量，无句向量
ELMo 在预训练阶段仅学习了语言模型，无句向量学习任务

GPT

在这里插入图片描述

Bert

与GPT的不同

用的是transformer的解码器能够捕获双向信息，并且使用了不同的训练方法可以捕获句子的信息（通过next-sentence的任务）。

ERNIE

与Bert不同

使用了更丰富的训练方法，效果更好

基于Bert 的双塔和单塔文本匹配

在这里插入图片描述

词法分析

词法分析的概念

在这里插入图片描述

词法分析的技术

字符串匹配

在这里插入图片描述

统计模型

在这里插入图片描述

序列标注模型

在这里插入图片描述

rnn

在这里插入图片描述

CRF

在这里插入图片描述
将结果经过一个crf矩阵以后再进行输出，crf矩阵表示相同类别之间的相关性。

预训练将 lstm 的部分换成预训练模型即可

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
百度飞桨nlp

百度nlp课程简要总结
复制链接

扫一扫

鸝u翾 CSDN认证博客专家 CSDN认证企业博客

码龄3年

1: 原创

182万+: 周排名

30万+: 总排名

351: 访问

: 等级

13: 积分

0: 粉丝

0: 获赞

1: 评论

0: 收藏

私信

关注

热门文章

百度飞桨nlp 352

分类专栏

百度nlp 打开活动

最新评论

百度飞桨nlp
CSDN-Ada助手: 恭喜你开始了博客创作！标题“百度飞桨nlp”很吸引人，看来你对自然语言处理领域很感兴趣呢。接下来，我建议你可以深入了解一些nlp的基础知识，比如词嵌入、情感分析等，也可以分享一些实际应用案例，让读者更容易理解和接受。希望你能坚持写下去，不断进步！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。