pytorch nn.Embedding()原理

最新推荐文章于 2024-08-08 09:48:41 发布

一壶浊酒..

最新推荐文章于 2024-08-08 09:48:41 发布

阅读量608

点赞数 1

文章标签： pytorch 深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40107571/article/details/130462878

版权

Word Embedding

Word embedding 是将自然语言中的词语映射为实数向量的一种技术，通常通过机器学习算法从文本数据中学习得到。其基本思想是将每个词语映射到高维空间中的一个向量，使得词语在语义上相似的向量在空间中距离较近，从而能够将自然语言中的词语转化为计算机能够处理的数值型数据。Word embedding 技术在自然语言处理、机器翻译、信息检索等领域得到了广泛应用。常见的 Word embedding 方法有 CBOW（Continuous Bag-of-Words）、Skip-gram 和 GloVe 等。

nn.Embedding

为什么使用嵌入层

1、使用One-hot 方法编码的向量会很高维也很稀疏。假设我们在做自然语言处理（NLP）中遇到了一个包含2000个词的字典，当使用One-hot编码时，每一个词会被一个包含2000个整数的向量来表示，其中1999个数字是0，如果字典再大一点，这种方法的计算效率会大打折扣。

2、训练神经网络的过程中，每个嵌入的向量都会得到更新。通过上面的图片我们就会发现在多维空间中词与词之间有多少相似性，这使我们能可视化的了解词语之间的关系，不仅仅是词语，任何能通过嵌入层 Embedding 转换成向量的内容都可以这样做。

参数

num_embeddings - 词嵌入字典大小，即一个字典里要有多少个词。
embedding_dim - 每个词嵌入向量的大小。

import torch

embedding=torch.nn.Embedding(10,10)
for i in range(10):
    print(i)
    tensor=torch.tensor(i)
    output=embedding(tensor)
    print(output)

参考：

经常提到的Embedding层有什么用？ | 机器之心 (jiqizhixin.com)

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

一壶浊酒.. CSDN认证博客专家 CSDN认证企业博客

码龄7年

466: 原创

6119: 周排名

6447: 总排名

46万+: 访问

: 等级

5323: 积分

1439: 粉丝

589: 获赞

73: 评论

1445: 收藏

私信

关注

热门文章

分类专栏

最新评论

Python logging模块的基本使用
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh_CN/latest 使用原生 loggng封装，兼容性和替换性100%,大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
python Canny边缘检测
白社会社长: 第二步好像没有用到sobel算子，这是为什么呢？
paddle 自定义数据集和预处理
NEVER GIVE UP198: 为什么我安装paddle装不上
数据结构和算法
人间无解: 非常欣赏博主的博客，每一篇都充满了智慧和深度。博主文笔流畅自然，能够轻松驾驭复杂的技术话题，将其转化为通俗易懂的语言。同时，您还善于结合实践经验和前沿技术，为我们提供了宝贵的参考和启示。每次阅读您的博客，我都能从中获得新的启发和收获，三连支持博主创作出更加优秀的文章，要是博主能对我的文章指点一下更好了，非常感谢大佬对我的帮助和支持！
Python logging模块的基本使用
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

一壶浊酒.. 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。