【多模态大模型学习--NLP基础知识1】word embedding词向量嵌入与bert模型（李宏毅）

最新推荐文章于 2024-07-24 11:48:04 发布

同屿Firmirin

最新推荐文章于 2024-07-24 11:48:04 发布

阅读量386

点赞数 6

文章标签：自然语言处理深度学习 embedding bert

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Mugi_jiang/article/details/138271552

版权

word embedding

1-of-N encoding

在这里插入图片描述
缺陷：无法表征单词间的词义关系，如无法表示cat和dog都是动物，所以应该更接近。

Word Class

在这里插入图片描述
缺陷：太粗糙了，例如dog和cat都是哺乳动物，应该和bird有所不同。

Word Embedding

在这里插入图片描述
使用一个多维向量表示一个词汇，每个维度就是一个可分类的维度，例如是否为动物，是否为哺乳类。

一词多义的编码

一个词可能有多种语义，那给如何对应embedding？
传统做法1：一个词对应一个embedding
传统做法2：查字典，每个意思对应一种embedding
但实际生活中一个词的语义不止词典中可以查到的。

Contextualized Word Embedding

每个word token都有一个embedding

ELMO（embedding from language model）

RNN-based model training from lots of sentences
预测下一个token
在这里插入图片描述
应该选哪一层的embedding？全都用

α1α2是学出来的，通过下游任务学习不同的权重

Bert

Bidirectional Encoder Representation from Transformer

training

下游任务

approach1

遮住部分词，预测这个词
在这里插入图片描述

approach2

给两个句子，bert预测这两个句子是否是连在一起的
使用特殊符号SEP表示两个句子是否相连
在这里插入图片描述
两个方法是同时使用的。

How to use

case1 句子分类

在这里插入图片描述
在下游任务中，分类头从头训练，bert微调

Case2 句子中的词汇分类

在这里插入图片描述

Case3

给定两个句子（前提和假设），判断这个逻辑推理是否正确
在这里插入图片描述

Case4

在这里插入图片描述
输入一篇文章D和问题Q，输出正确答案在D中出现的位置（必然在文中出现过）
具体实现：
两个token分别表征正确答案出现位置的左边界和右边界，计算作者两个token和文章对应token的点乘结果，再取softmax结果，最高结果对应的位置的范围是所求结果（可能存在左>右，此时认为该任务无解）

关注

6
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
【多模态大模型学习--NLP基础知识1】word embedding词向量嵌入与bert模型（李宏毅）

缺陷：无法表征单词间的词义关系，如无法表示cat和dog都是动物，所以应该更接近。
复制链接

扫一扫

同屿Firmirin CSDN认证博客专家 CSDN认证企业博客

码龄5年

18: 原创

13万+: 周排名

6万+: 总排名

1万+: 访问

: 等级

391: 积分

181: 粉丝

197: 获赞

5: 评论

139: 收藏

私信

关注

热门文章

分类专栏

最新评论

【OCR多模态大模型paper阅读笔记--4】InternLM-XComposer2-4KHD精读，8B文档理解新SOTA！中文能力优秀的OCR大模型
同屿Firmirin: 还没有，做了会更一篇
【OCR多模态大模型paper阅读笔记--4】InternLM-XComposer2-4KHD精读，8B文档理解新SOTA！中文能力优秀的OCR大模型
qq_37927576: 有和后来的minicpm-2.5做过对比吗，感觉切分的思路比较像
【多模态大模型阅读笔记--1】多模态大模型入门，MLLM综述：MM-LLMs: Recent Advances in MultiModal Large Language Models
CSDN-Ada助手: 恭喜您完成了第7篇博客，标题内容看起来非常专业和引人入胜！继续保持创作的热情和努力，让更多读者受益于您的知识分享。或许在下一篇博客中，您可以深入分析某一种多模态大模型的应用案例，或者探讨该领域的未来发展趋势，这样会更加丰富和有深度。期待您的下一篇作品！
【多模态大模型学习--llava部署踩坑：google.protobuf.message.DecodeError: Error parsing message】
CSDN-Ada助手: 恭喜您写了第三篇博客！看到您在llava部署过程中踩坑并解决问题的经验总结，让我受益匪浅。在下一篇博客中，或许您可以分享一些更具体的部署技巧或者实践案例，让读者更好地理解和应用这些知识。期待您的下一篇作品！祝您创作愉快！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
【多模态大模型学习--llava部署踩坑：conda虚拟环境flash-attn安装】RuntimeError: FlashAttention is only supported on CUDA11
CSDN-Ada助手: 恭喜您发布了第四篇博客，看来您对多模态大模型学习有着深入的研究！同时，感谢您分享了在conda虚拟环境下flash-attn包安装部署的经验，这对正在学习相关内容的读者们应该会非常有帮助。在下一步的创作中，或许您可以考虑分享一些实际应用案例或者解决问题的思路，让读者能够更加深入地了解到您的研究成果。期待您更多的精彩内容，谢谢您的分享！愿您在学术道路上不断进步，共同成长。如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。