TextCNN和DPCNN

一、TextCNN

TextCNN详细过程
在这里插入图片描述

二、DPCNN

1、背景

近期在分析长短文本的分类问题,所以探索并比较了一些模型选型方案,一般简单的短文本分类模型可以将TextCNN模型作为baseline,但是如果文本较长,TextCNN就不太适用了。因为TextCNN是浅层网络【ShallowCNN,下图(b)所示】,对文本的长距离依赖捕获能力有限,若想要克服TextCNN的缺点,显然要用到特征提取能力更强的DeepCNN。

那么该如何构造这种DeepCNN的网络结构呢?比如最简单的直接一堆等长卷积可否?显然这样会让越来越多的词位信息包含进来,但效率太低了,显然会增加网络的计算量,不能有!

既然等长卷积会让每个词位的embedding描述语义描述的更加丰富准确,那么我们退而求其次,适当堆两层来提高词位embedding表示的丰富性,意思一下~。

在此之前,以TextCNN为代表的word-level级别的文本分类模型提出后,后面就没有比较有效的CNN系列模型。因此,论文提出了一种word-level级别的网络DPCNN,由于TextCNN不能通过卷积捕获文本的长距离依赖,而DPCNN通过不断加深网络,可捕获文本的长距离依赖关系

2、网络结构特征

DPCNN(a)图,TextCNN(b)图。我们可以对比着看。

DPCNN模型的网络结构主要包括:

  • 1.Text region embedding层(word embedding经1层卷积后的输出);
  • 2.等长卷积层(2层CNN);
  • 3.带有Downsampling的等长卷积块层(6层)【Figure1(a)中的蓝色框部分】;
  • 4.全连接层。
    在这里插入图片描述

Region embedding的区别
在这里插入图片描述
等长卷积
在这里插入图片描述
1/2池化层
在这里插入图片描述

残差网络

既然是深层CNN模型,那么就不得不关注梯度弥散/爆炸、网络退化等问题。
在这里插入图片描述

3、DPCNN总结

在这里插入图片描述

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值