论文阅读:ReNet: A Recurrent Neural Network Based Alternative to Convolutional Networks

本文提出ReNet,一种基于RNN的深度神经网络结构,用于目标识别,以解决卷积网络中信息丢失的问题。ReNet通过RNN单元对图像进行横向和纵向的双向扫描,获取特征图并拼接。实验证明,ReNet在MNIST、CIFAR-10和SVHN数据集上表现出色,展示了RNN在图像处理中的潜力。
摘要由CSDN通过智能技术生成

1 摘要

本文提出一个叫ReNet的深度神经网络结构用于目标识别,该网络使用RNN代替了大部分的卷积+池化操作部分,通过使用RNN单元对图像块进行横向扫描、垂直扫描得到两个特征图再进行拼接。该网络在MNIST、CIFAR-10、SVHN数据集均有较好的表现。

2 亮点

2.1 使用RNN处理图像

作者认为使用池化层+卷积层会使得图像的信息丢失严重。因此作者使用RNN来避免池化操作。RNN一般是用于处理序列数据,如:语音识别、机器翻译等,RNN的结构图如下:
在这里插入图片描述
可以看到左边的RNN可以展开成右边,每个时刻的RNN都与当前和之前的有关。有关RNN更详细的资料可以参考:

RNN—从入门到放弃

而如果是处理图像,一般使用的是多维RNN,就是RNN有很多层。这样会使得计算量变得很大。而作者提出的RNN处理方式,不同于一般处理图片的RNN是使用多维RNN处理的。所以作者打算每次只处理图像的一行或者一列,使用BRNN处理(BRNN详细资料戳这!),BRNN就是双向的RNN。将图片划分成IxJ块,每块大小为 w p w_p wp × h p h_p hp

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值