特征工程之 embedding层

最新推荐文章于 2024-05-20 09:10:09 发布

tiki_taka_

最新推荐文章于 2024-05-20 09:10:09 发布

阅读量521

点赞数

分类专栏：机器学习文章标签：自然语言处理深度学习神经网络

本文链接：https://blog.csdn.net/qq_24729325/article/details/120264550

版权

机器学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

TensorFlow中文官方网站离散和连续特征怎么喂入模型：https://tensorflow.google.cn/tutorials/structured_data/preprocessing_layers
Keras 和 TensorFlow 版本匹配信息：https://docs.floydhub.com/guides/environments/
Keras Embedding 和W2V例子：https://zhuanlan.zhihu.com/p/279395289
Keras 自定义Embedding层（电影分类）：https://lauzyhou.blog.csdn.net/article/details/89421674
Keras 加载 & 未加载预训练模型例子：https://blog.csdn.net/weixin_42259192/article/details/99888561
Embedding 和 Word2Vec 实战 https://www.cnblogs.com/dogecheng/p/11565530.html

TensorFlow 中，Keras中Embedding：

Embedding 加入模型，有以下几种方式，

纯 Embedding方式

model.add(
Embedding(
input_dim, 词典长度
output_dim,降到多少维
input_length,句子的长度
)
)
model.add( Flatten())
解释：将 3 维的嵌入张量展平成形状为（samples ，input_length * output_dim）的二维向量，
如果，后面接入 LSTM ，不用 flatten 展平。
Model.add(Dense(
Units = 32,
Input_dim = input_dim 词典长度
)
)
解释：词袋模型，一个句子中，单词所在词典中的位置置为 1，剩下全0，k-hot 编码

接入 word2vec
     3.1. 未加载 预训练 模型：
         from keras.layers import Embedding
    
         max_len = 20 句子的长度
         vocab_size = 1000 词典的长度
         vocab_dim = 300 词向量 维度

         input_ = Input(shape = (max_len, ))
         emd = Embedding(input_dim = vocab_size , output_dim = 300, input_length = max_len)(input_)
     3.2. 加载预训练模型
         from keras.layers import Embedding

         max_len = 20 句子的长度
         vocab_size = 1000
         vocab_dim = 150 词向量 维度
         #embedding_matri为预训练单词的权重矩阵
         input_ = Input(shape = (max_len, ))
         emd = Embedding(input_dim=vocab_size , output_dim=150, input_length=max_len, weights=[embedding_matrix], trainable=False)(input_)

tiki_taka_

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
特征工程之 embedding层

TensorFlow中文官方网站离散和连续特征怎么喂入模型：https://tensorflow.google.cn/tutorials/structured_data/preprocessing_layersKeras 和 TensorFlow 版本匹配信息：https://docs.floydhub.com/guides/environments/Keras Embedding 和W2V例子：https://zhuanlan.zhihu.com/p/279395289Keras 自定义Embed
复制链接

扫一扫