keras.layers.Embedding层介绍

会发paper的学渣

已于 2022-04-08 14:31:44 修改

阅读量4.5k

点赞数

分类专栏： tensorflow2.x 文章标签： tensorflow

于 2022-03-28 18:00:54 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sslfk/article/details/123801513

版权

tensorflow2.x 专栏收录该内容

39 篇文章 1 订阅

订阅专栏

本层应用，就是把稀疏矩阵变成一个密集矩阵，也称为查表，因为他们之间是一个一一映射关系。与其对应的是one-hot编码，multi-hot编码，对于特征维度过大的应用，直接使用会造成维度灾难。

Embedding层本质也是一个映射，不过不是映射为on-hot编码，而是映射为一个指定维度的向量，该向量是一个变量，通过学习寻找到最优值；此过程类似word2vec的原理。

而通常输入的特征都是字符串，所以在映射之前先转化为数字，也就是StringLookup对应的count模式所做的事情。

使用方式如下：

import tensorflow as tf
#其中1000表示input_dimension,也就是词汇表的大小，size of vocabulary
embedding = tf.keras.layers.Embedding(1000, 64)
input_array = np.random.randint(20, size=(32, 10))
embedding(input_array)
#输出，数字会随着模型的训练而变化调优
<tf.Tensor: shape=(32, 10, 64), dtype=float32, numpy=
array([[[-0.00223513,  0.04911561,  0.03994017, ..., -0.00141234,
          0.03842745, -0.03368234],
        [-0.00223513,  0.04911561,  0.03994017, ..., -0.00141234,
          0.03842745, -0.03368234],
        [-0.02339436, -0.03834909,  0.01074553, ...,  0.01113864,
         -0.04465676,  0.02594434],
        ...,
        [ 0.02353707,  0.02030389, -0.03473636, ..., -0.00815297,
         -0.0427214 , -0.02282931],
        [ 0.02353707,  0.02030389, -0.03473636, ..., -0.00815297,
         -0.0427214 , -0.02282931],

降维的原理和意义，参考：深度学习-函数-tf.nn.embedding_lookup 与tf.keras.layers.Embedding_茫茫人海一粒沙的博客-CSDN博客

会发paper的学渣

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

会发paper的学渣 CSDN认证博客专家 CSDN认证企业博客

码龄13年

195: 原创

5万+: 周排名

2万+: 总排名

33万+: 访问

: 等级

2251: 积分

158: 粉丝

227: 获赞

89: 评论

962: 收藏

私信

关注

热门文章

分类专栏

深度学习基础 24篇
elasticsearch 16篇
tensorflow2.x 39篇
NLP 29篇
搜索 9篇
推荐 17篇
大模型 1篇
linux 8篇
python3 23篇
问题
模型训练 4篇
ocr 1篇
联想 2篇
neo4j 1篇
知识图谱 7篇
kafka 2篇
tfrs 1篇
pandas 2篇
加密算法 2篇
springcloud 1篇
awk 1篇
springboot继承 1篇
大数据算法 4篇
传统算法
札记 11篇
spark学习 3篇

最新评论

basicsr 安装问题
sad209: pip install torch=这里少了个等于号2.1.2 torchvision==0.16.2 -i https://download.pytorch.org/whl/cu118
elasticsearch 关于向量化检索
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
cube-studio 部署过程
源泉775: 道友，你弄出来了吗
wave2lip训练
weixin_45561370: 你好，请问一下你生成那三个文件了吗
数据集下载渠道汇总
m0_62196601: https://computenest.console.aliyun.com/user/dataset/cn-hangzhou 阿里云的「计算巢」产品现已更新，增添了多个热门中文数据集，以便大家能够更便捷地进行数据分析和机器学习项目。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

会发paper的学渣 您的鼓励和将是我前进的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。