2019-12-10 学习总结

最新推荐文章于 2024-01-08 15:58:20 发布

Trizzz

最新推荐文章于 2024-01-08 15:58:20 发布

阅读量133

点赞数

分类专栏：学习总结

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46040552/article/details/103584337

版权

学习总结专栏收录该内容

7 篇文章 0 订阅

订阅专栏

看代码的过程中，发现自己的基础特别薄弱。要慢慢积累呀。

1、深度学习网络是越深越好吗？——网络的degradation问题

在我的一般印象中，深度神经网络区别于一般神经网络的地方，就在于它的“深度”两个字。那神经网络的深度对神经网络具体有什么影响呢？

从Alexnet采取的7层神经网络开始，后有VGG为了探索神经网络最多能有多深，而采取的16/19层神经网络，再到Googlenet的22层。有人已经发现深度CNN网络在到达一定的深度后，即便再增加层数，网络的分类性能也不会提高，网络反而收敛的更慢，在测试集上的准确率也变差了（排除了数据集国小带来的过拟合等问题）。这个问题就是网络的degradation问题。

《Identity Mappings in Deep Residual Networks》中证明了degradation的产生是由于优化性能不好，这说明越深的网络反向梯度越难传导。

2、Resnet——前向：恒等映射 / 反向：对梯度敏感

已知有网络degradation的情况下，不求加深度能提高准确性，能不能至少让深度网络实现和浅层网络一样的性能，即让深度网络后面的层至少实现恒等映射的作用

从而提出了Residual Module，提高了网络能采取的深度。

在前向过程中，当浅层的输出已经足够成熟（optimal），那残差模块能使深层网络后面的层实现恒等映射的作用。

在反向过程中，residual模块会明显减小模块中参数的值从而让网络中的参数对反向传导的损失值有更敏感的响应能力，虽然根本上没有解决回传的损失小得问题，但是却让参数减小，相对而言增加了回传损失的效果，也产生了一定的正则化作用

加强版的resnet部分我还没有看，以上内容都是学习博文：https://blog.csdn.net/weixin_43624538/article/details/85049699

3、deeplab代码中input_stride和output_stride分别的意义 ——input_stride是参数，output_stride是现象

input stride为我们正常进行卷积时候，给filter设置的stride值，

output stride为该矩阵经过多次卷积pooling操作后，尺寸缩小的值，例如：

input image为224 x 224，经过多次卷积pooling操作后，feature map为7 x 7，那么output stride为224/7 = 32.(Approximate of what happened to the image after down sampling .)

参考：https://blog.csdn.net/weixin_39610043/article/details/87165968

4、对dilation，stride，paddings，transposed更直观的理解——理解新名词dilation

参考：https://github.com/vdumoulin/conv_arithmetic/blob/master/README.md

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Trizzz CSDN认证博客专家 CSDN认证企业博客

码龄5年

27: 原创

55万+: 周排名

221万+: 总排名

1万+: 访问

: 等级

332: 积分

7: 粉丝

5: 获赞

2: 评论

25: 收藏

私信

关注

热门文章

分类专栏

最新评论

cityscapes.py阅读笔记
无处不乐zhc: # 将属于valid_classes的像素类别转成class_map对应的元素值。 for _validc in self.valid_classes: mask[mask == _validc] = self.class_map[_validc] 这一步的作用是什么
FCN论文阅读记录
Riser. deep: ‘’这种转化使得任意大小的图像都可以作为输入图像‘’是因为利用卷积代替了传统网络最后的全连接层，因为卷积层是一个一定大小的卷积核在一张输入特征图上滑动，所以输入输出都是任意的（但是输入输出之间是绝对关联的），但全连接层是将一个向量转化为另一个向量，由于其参数量（对应吴恩达课程中的w,b）是固定的，所以输入输出是固定的，全卷积网络将最后几个全连接层改成卷积层，实际上就是将全连接层的参数聚集成一个卷积核，能实现原来相同的功能，这个我不记得是在吴恩达深度学习经典网络课程中还是Googlenet的论文中有提及，博主可以参考。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。