keras 生成句子向量 词向量_Keras -- 词向量 CNN

词向量:

GloVe词向量:2014年的英文维基百科上训练。400k词 每个词100维向量表示。

数据集:

20种新闻文本数据。

步骤:

1.把新闻样本转化为词索引序列。

词索引:每个词依次分配一个ID,只保留最常见的词。

2.生成一个词向量矩阵。第i列表示词索引为i的词的词向量。

3.将词向量矩阵载入Keras Embedding层。设置该层的权重不可在训练(把数据转成系数向量)https://www.zhihu.com/question/344209738

4.Kearas Embedding层之后连接一个1D的卷积层。用softmax全连接输出新闻类别。(特征抽取)https://www.jianshu.com/p/88bb976ccbd9

代码见:

CNN讲解---------------李宏毅:

举例:判断一张图是否有鸟嘴(pattern)

1、只需要选取这张图的一小部分来判断,从而减少参数。  (Convolution)

2、同样的pattern可能分布在不同的位置,但处理方法都相同    (Convolution)

3、缩小图片并不会影响物体的整体形状。 (Max-pooling)

Filter 是一个矩阵,他们的值是神经网络需要学的参数。

之后我们在图片上选取一个一个窗口,让他们与Filter做内积,直到所有窗口选完,最后又得到一个矩阵叫做Feature Map

把Feature Map(输出层)的每一个位置的值对应于窗口(输入层)。(其实是一个全连接层)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值