「论文阅读笔记」Deep Hierarchical Saliency Network for Salient Object Detection

纪念第一次写博客的我

想法很简单,记录看过的论文总结出优劣以供自己以后有想法的时候随时查阅

也算是不错的研究生生活的开端

花了一星期看了比较经典,而且是一个显著性检测的2D算法——DHSnet(Deep Hierarchical Saliency Network for Salient Object Detection)

整体结构如下图所示

DHSnet

整个DHSnet分为 GV-CNNHRCNN。图片先由一个简单的VGG-16处理再经过全连接层重塑成28x28大小的图片,全连接层头上的784就是28x28,这张图片被称为粗略的全局图像 SmG,值得注意的是,在VGG卷积层上的数字是特征图的分辨率大小,而不是通道数,然后从VGG的不同卷积层中抽取低级特征逐步地分层次地使用RCL(Recurrent Convolutional Layer)SmG级联融合,最后以真值重塑的不同尺寸的图片作监督,输出结果

上采样的作用是什么

举个例子 SMRCL4的尺寸是28x28,而需要与它融合的卷积层是56x56,这个时候就需要做上采样将图像分辨率放大

为什么使用RCL,使用RCL的优势是什么

不像之前的算法为了追求图像细节过分进行图像分割而导致耗时长,传统的decoder使用的卷积层参数多训练慢,该算法整合了RCL模块分层次渐进式对图像进行细节的恢复,不仅耗时短而且质量也好。在论文的另一部分专门介绍了RCL的作用,我的理解是,RCL中只涉及2个不同的卷积层,通过4次的循环调用达到效果,而不需要去增加额外卷积层导致参数过多。

论文还从 感受野的缩小可视化替换传统卷积层GPU运行时间来说明RCL的效果

感受野缩小

可视化

替换传统卷积层时
在这里插入图片描述

在复现代码的时候出现了 **ValueError: operands could not be broadcast together with shapes (224,224) (3,) (224,224) **

如何解决请戳这里

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值