图像分类算法ResNet论文解读

最新推荐文章于 2024-07-17 08:37:33 发布

纸上得来终觉浅～

最新推荐文章于 2024-07-17 08:37:33 发布

阅读量3.8k

点赞数

分类专栏：图像处理 paper阅读文章标签： ResNet 图像分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_32172681/article/details/99849131

版权

论文名称：Deep Residual Learning for Image Recognition

论文地址：https://arxiv.org/pdf/1512.03385.pdf

代码地址：https://github.com/tensorflow/tensorflow/blob/master/tensorflow/contrib/slim/python/slim/nets/resnet_v1.py

ResNet的贡献在于，不直接训练多层卷积层网络H(x)，而是训练输入x和输出之间的残差函数F(x)=H(x)−x，解决了梯度弥散问题，训练了更深的网络，模型没有更复杂，但准确率提升。

一、论文理解

1、网络退化问题

随着网络的加深，梯度弥散问题会越来越严重，导致网络很难收敛甚至无法收敛。梯度弥散问题目前有很多的解决办法，包括网络初始标准化，初始数据标准化以及中间层标准化（Batch Normalization）等。但是网络加深还会带来另外一个问题：随着网络加深，出现训练集准确率下降的现象，如下图：

然而，由图知，这并不是由过拟合引起的。

2、ResNet训练更深层次的网络

由于梯度消失/爆炸问题阻止训练的收敛，深层次的网络往往难以训练，ResNet提出了残差学习框架以简化深层的网络训练，为输入层定义残差函数，而不是直接训练卷积神经网络。ResNet训练了深度高达152层的残差网络（比VGG网络深8倍），但仍然具有较低的复杂度，产生的结果也更精确，在2015年的ILSVRC分类任务中获得第一名。

3、残差表示

ResNet 的出发点是，在一个浅层的网络模型上进行改造，将新的模型与原来的浅层模型相比较，改造后的模型至少不应该比原来的模型表现要差，极端情况下，新加层的结果为 0，这样它就等同于原来的模型了。

假设现在有一个由2个卷积层堆叠的卷积栈，将这个栈的输入/输出之间的原始映射称为 underlying mapping，ResNet 用 residual mapping 去替换underlying mapping。将 underlying mapping 标记为 H(x) ，将经过堆叠的非线性层产生的 mapping 标记为 F(x)=H(x)−x ，最原始的映射就被强制转换成 F(x)+x，这种恒等映射学习起来更容易。

4、正向传播与反向传播

假设卷积栈的输入为x，则输出可以定义为：

设为卷积栈的输入，为卷积栈的输出，则残差网络正向传播公式为，加和是指第l层和L-1层之间的残差F(x)：

ε 代表的是 loss 方程，由链式求导法得：

最低0.47元/天解锁文章

纸上得来终觉浅～

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
图像分类算法ResNet论文解读

论文名称：Deep Residual Learning for Image Recognition论文地址：https://arxiv.org/pdf/1512.03385.pdf代码地址：https://github.com/tensorflow/tensorflow/blob/master/tensorflow/contrib/slim/python/slim/nets/resnet_...
复制链接

扫一扫

专栏目录

纸上得来终觉浅～ CSDN认证博客专家 CSDN认证企业博客

码龄9年

151: 原创

17万+: 周排名

43万+: 总排名

88万+: 访问

: 等级

8589: 积分

212: 粉丝

580: 获赞

117: 评论

3242: 收藏

私信

关注

热门文章

分类专栏

语音识别 52篇
linux 3篇
工作
传统图像处理 13篇
数学 4篇
java 40篇
数据结构与算法 14篇
keras 2篇
ocr 2篇
图像处理 56篇
python 15篇
tensorflow 24篇
深度学习 79篇
机器学习 44篇
pandas 1篇
Kaggle 2篇
paper阅读 21篇
其他 39篇

最新评论

边缘检测：Canny算子
Midsummer-逐梦: 原图像
基于Kaldi+GStreamer搭建线上的实时语音识别器
m0_75126569: 和你一样
基于Kaldi+GStreamer搭建线上的实时语音识别器
m0_75126569: root@ubuntu:~/kaldi/kaldi-gstreamer-server/test/models# ./download-tedlium-nnet2.sh % Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 0 0 0 0 0 0 0 0 --:--:-- 0:00:20 --:--:-- 0curl: (7) Failed to connect to phon.ioc.ee port 443: Connection refused gzip: stdin: unexpected end of file tar: Child returned status 1 tar: Error is not recoverable: exiting now
基于Kaldi+GStreamer搭建线上的实时语音识别器
小萌新Z: ot@zpq-virtual-machine:/home/zpq/桌面/kaldi-gstreamer-server/test/models# ./download-tedlium-nnet2.sh % Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 0 0 0 0 0 0 0 0 --:--:-- 0:00:21 --:--:-- 0 curl: (7) Failed to connect to phon.ioc.ee port 8080 after 21352 ms: 连接被拒绝这是什么问题
语义分割算法Mask RCNN论文解读
惑许414: Traceback (most recent call last): File "D:/A_mask/mask R_CNN/Mask_RCNN-master/mrcnn/parallel_model.py", line 160, in <module> model = ParallelModel(model, GPU_COUNT) File "D:/A_mask/mask R_CNN/Mask_RCNN-master/mrcnn/parallel_model.py", line 38, in __init__ merged_outputs = self.make_parallel() File "D:/A_mask/mask R_CNN/Mask_RCNN-master/mrcnn/parallel_model.py", line 62, in make_parallel for name, x in zip(self.inner_model.input_names, AttributeError: 'Model' object has no attribute 'input_names' 怎么解决呢请问

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。