DPCNN做文本分类《Deep Pyramid Convolutional Neural Networks for Text Categorization》

原文链接
本文发表于自然语言处理领域顶级会议 ACL 2017
代码链接

摘要

本文提出了一种新型的CNN结构,可以有效提取文本中的远程关系特征,并且复杂度不高。实验证明,效果比以往的CNN结构要好。

模型

本文提出的模型为Word-level deep pyramid CNN (DPCNN) ,其结构如下图所示:
结构
1.Region embedding
这个步骤可以理解为,将onehot lookup (或n-gram,bow)得到embedding之后随着CNN一起被优化
2.Unsupervised embeddings
预训练得到了word embedding(比如w2v,glove等)


前人提出的一些模型在做下采样(pooling)时增加feature map(卷积核)的数量,使算法时间复杂度变成了与模型深度有关的函数,本文研究发现这样做除了白白增加了工作量以外,对提升准确率没有任何帮助,故本文固定了feature map(卷积核)的数量。
这样一来,每做一次下采样,下一个卷积层的size就会减半,如图所示:
减半
因此本文提出的模型的计算时间复杂为最长块的计算时间的两倍,是常数级别的,故本文的模型计算要快得多。并且这样不断的下采样,可以增加卷积核对原文的覆盖度,在L次下采样之后,卷积核相当于覆盖了 2 L 2^L 2L 长度的原文。(但这样不会丢失信息吗?),因此模型对全局特征的提取能力得到了大幅增强。

  • 4
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值