特征工程 之 embedding层

TensorFlow中文官方网站离散和连续特征怎么喂入模型:https://tensorflow.google.cn/tutorials/structured_data/preprocessing_layers
Keras 和 TensorFlow 版本 匹配信息:https://docs.floydhub.com/guides/environments/
Keras Embedding 和W2V例子:https://zhuanlan.zhihu.com/p/279395289
Keras 自定义Embedding层(电影分类):https://lauzyhou.blog.csdn.net/article/details/89421674
Keras 加载 & 未加载 预训练模型例子:https://blog.csdn.net/weixin_42259192/article/details/99888561
Embedding 和 Word2Vec 实战 https://www.cnblogs.com/dogecheng/p/11565530.html

TensorFlow 中,Keras中Embedding:

Embedding 加入模型,有以下几种方式,

纯 Embedding方式

  1. model.add(
    Embedding(
    input_dim, 词典 长度
    output_dim,降到多少维
    input_length,句子的长度
    )
    )
    model.add( Flatten())
    解释:将 3 维 的嵌入 张量展平成 形状 为 (samples ,input_length * output_dim)的 二维向量,
    如果,后面接入 LSTM , 不用 flatten 展平。

  2. Model.add(Dense(
    Units = 32,
    Input_dim = input_dim 词典 长度
    )
    )
    解释:词袋模型,一个句子中,单词 所在词典中的位置 置为 1,剩下全0,k-hot 编码

  3. 接入 word2vec
         3.1. 未加载 预训练 模型:
             from keras.layers import Embedding
        
             max_len = 20 句子的长度
             vocab_size = 1000 词典的长度
             vocab_dim = 300 词向量 维度
    
             input_ = Input(shape = (max_len, ))
             emd = Embedding(input_dim = vocab_size , output_dim = 300, input_length = max_len)(input_)
         3.2. 加载预训练模型
             from keras.layers import Embedding
    
             max_len = 20 句子的长度
             vocab_size = 1000
             vocab_dim = 150 词向量 维度
             #embedding_matri为预训练单词的权重矩阵
             input_ = Input(shape = (max_len, ))
             emd = Embedding(input_dim=vocab_size , output_dim=150, input_length=max_len, weights=[embedding_matrix], trainable=False)(input_)
    
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

tiki_taka_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值