Self-attention与Word2Vec

星辰漫步之LLM

已于 2024-02-24 18:09:24 修改

阅读量503

点赞数 8

分类专栏：大语言模型文章标签： llm 大语言模型自然语言处理词嵌入

于 2024-02-24 18:03:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hhl_csdn/article/details/136274268

版权

本文对比了两种词嵌入技术——Word2Vec和Self-attention。Word2Vec通过分析大量文本数据学习全局向量表示，忽略了上下文影响；而Self-attention则在Transformer等模型中动态调整元素间关联度，根据上下文生成多义词的不同表示，更适合处理序列数据。

摘要由CSDN通过智能技术生成

Self-attention（自注意力）和 Word2Vec 是两种不同的词嵌入技术，用于将单词映射到低维向量空间。它们之间的区别：

Word2Vec：
- Word2Vec 是一种传统的词嵌入（word embedding）方法，旨在为每个单词学习一个全局的向量表示。
- 它通过分析大量文本数据，将单词映射到一个连续的向量空间中，使得相似的单词在向量空间中距离较近。
- Word2Vec 忽略了单词在不同上下文中的含义，因此对于多义词（例如，“left”在不同语境中有不同含义）只学习了一个表示。
Self-attention：
- Self-attention 是一种用于序列数据的机制，特别在 Transformer，BERT, GPT模型中广泛应用。
- 它允许模型根据输入序列的上下文动态调整不同元素的影响。
- Self-attention 考虑了每个输入元素与其他元素之间的关联度，从而生成不同的表示。
- 在自然语言处理中，Self-attention 可以根据单词在句子中的上下文生成不同的表示（contextual embedding），解决了多义词的问题。

总之，Word2Vec 是一种全局的词嵌入方法，而Self-attention 允许根据上下文动态生成不同的表示，更适合处理多义词和序列数据。

星辰漫步之LLM

关注

8
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。