CNN用于文本分类

简述

概括来讲,就是对不同尺度的窗口分别卷积,各尺度分别对不同时刻向量进行max-pooling,经过几层全连接之后进行分类,用word2vec来初始化输入矩阵有明显效果

文章全名:Convolutional Neural Networks for Sentence Classification

网络结构

缺图

从左向右看:

第一层对各词进行向量化,向量化有两种方式:1、取预训练结果 2、随机初始化。从结果来看,取预训练向量结果远远好于随机初始化结果,随机初始化的结果不如当前state-of-art,如果还能在训练过程中,对词向量进行微调,效果还能再好一丁点。

第二层是多尺度窗口卷积层,也是文章的核心,相当于取句子不同阶数的ngram,实验中用了3, 4, 5三个尺度

第三层对每个尺度,只取最大。

最后的全连接层,用了比较激进的正则化方法,来防止过拟合,用高达50%的概率进行dropout

其他

文章还对比了同时两组词向量,但只调节其中一组,改进并不明显

不同尺度如果只留一个pooling结果,可能会有一些信息损失,文章并没有做这方面的对比尝试,但15年的另一篇文章作了对比,发现改成k-max-pooling(k>=3)还不如1-max-pool

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值