自监督｜「ResNet v1」阅读笔记

-江户川-

已于 2022-01-19 15:26:05 修改

阅读量2.6k

点赞数 3

分类专栏： -江户川-的自监督论文集文章标签：深度学习计算机视觉机器学习

于 2022-01-19 14:58:27 首次发布

本文链接：https://blog.csdn.net/weixin_43092343/article/details/122577834

版权

本文是关于ResNet v1的阅读笔记，探讨深度学习中残差网络如何解决深度模型的退化问题。文章介绍了ResNet的优化效果、残差学习的概念，以及10-crop testing的细节和目的。实验结果显示ResNet在ImageNet验证集上表现出较低的错误率。

摘要由CSDN通过智能技术生成

「ResNet v1」阅读笔记

前段时间读了不少cv的自监督论文，通过自己的输出加强理解，同时也通过平台将自己的想法展示给大家，方便交流。
论文：Deep Residual Learning for Image Recognition
地址：Deep Residual Learning for Image Recognition

Intro

模型层数增加会导致梯度爆炸和梯度消失，解决方法有：1. 初始化的时候进行normalization；2. 中间加入BN。现在存在degration 问题：网络深度（层数）增加，准确率逐步饱和，然后快速degrate（下降）；经过分析，导致degration的原因不是由于过拟合，增加更多层会导致更高的训练误差。

论文建立深度残差网络结构: 用浅层学习x，再用深层为 residual 建模，最后直接加在一起。并通过实验证明：1. ResNet 更好优化，原始的stack layers训练误差更大；2. ResNet会从深度增加过程获得更大收益

Related Work

Residual representation: 图像识别领域有 VLAD模型，Fisher Vector是VLAD的概率模型；偏微分方程领域，Multigrid方法也有广泛的应用。残差表征在这两个领域的使用说明变形和预先处理可以简化优化问题。
此外，Shortcut 的概念在2015年的论文 Highway networks 中就提出了。同时我找了原理部分的译文描述，方便理解。
highway 原理，中文注解