VDCNN(EACL 2017)

VDCNN是一种基于字符级别的深度卷积神经网络,主要应用于自然语言处理任务。该模型包含29个卷积层,通过小尺度卷积和k-max pooling保留位置信息。与RNN和浅层CNN相比,VDCNN在增加深度后性能逐渐提高,尤其在大数据集上表现出色,且不需要数据增强技术。尽管性能不随深度单调增长,29层网络达到最优,ResNet的shortcut结构有助于缓解深度增加带来的性能下降问题。
摘要由CSDN通过智能技术生成

论文链接:

https://arxiv.org/abs/1606.01781

论文动机:

在NLP任务中,RNN和CNN都是常用的方法,但与CV中的深度卷积网络相比,NLP使用的基本都是浅层网络。大家普遍认为加深网络深度并没有太大意义。

 

VDCNN架构:

VDCNN基于字符级别(character level),只利用小尺度的卷积核池化操作,包含了29个卷积层。

 

句子长度为s,论文中固定s=1024。经过lookup层,每个字符映射成一个16维的向量(character embedding)。为减少内存的占用,借鉴VGG和ResNets的两个设计规则:

1、对于相同的输出特征图大小,图层有相同数量的滤波器

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值