深度学习笔记-GCN+卷积方式汇总

最新推荐文章于 2024-05-06 15:59:30 发布

地表最菜研究生

最新推荐文章于 2024-05-06 15:59:30 发布

阅读量2.5k

点赞数

分类专栏：深度学习笔记论文语义分割文章标签：深度学习计算机视觉

本文链接：https://blog.csdn.net/tuanzi2809/article/details/122209210

版权

33 篇文章 6 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

本文探讨了为何使用小卷积核而非大卷积核，介绍了空洞卷积如何扩大感受野，以及非对称卷积如何减少计算量。此外，还提到了可变形卷积在网络中的应用，尤其是在语义分割任务中的优势，它在分类和定位之间找到了平衡，减少了大卷积核的参数量，并在多个数据集上取得了高精度的miou。

摘要由CSDN通过智能技术生成

卷积方式汇总 convolution summary

自从VGG网络开始，叠加的小卷积核已经成为流行，因为能够使用更小的参数量实现特征提取。

大卷积核
优点：感受域大
举例：AlexNet、LeNet等网络都使用了较大的卷积核，例如5x5，11x11
缺点：参数量大，计算量大（硬件设备不成熟的情况下需要进行分组计算）
小卷积核
优点：参数量少；计算量少；整合三个非线性激活层代理单一非线性激活层，增加模型的判别能力
举例：VGG之后
缺点：感受域不足；深度堆叠卷积容易出现不可控的因素（梯度消失问题，堆叠多层卷积后效果反而变差）

通过输入的时候使用大卷积核，后续堆叠小卷积核的性价比比较高，被众多模型采用。但是在实际项目中需要通过实际的使用需求调整，最终目的是提升miou。

标准的3x3卷积只能看到对应区域3x3的大小，但是为了能让卷积核看到更大的范围，空洞卷积dilated conv使其成为可能。pooling下采样操作导致的信息丢失是不可逆的，这不利于像素级分割任务，使用空洞卷积替代pooling的作用（成倍的增加感受野）更加适合语义分割。

非对称卷积示意图
不一定是正方形，可以将3x3的卷积拆分未1x3和3x1的卷积，在不改变感受野大小的情况下可减少计算量

分组卷积

随机分组

在这里插入图片描述

在这里插入图片描述

卷积核偏移

语义分割可以看成是一个逐像素分类的任务，包含分类和定位两个挑战。一个好的语义分割模型应该能够同时处理好上述两个任务
语义分割的两个方面(分类和定位)天然对立。对于分类任务，模型必须是具有不变性的，以适应目标的各种形式，如平移和倒转；而对于定位任务，模型应该是对变换敏感的，即能够精确定位语义类别的每个像素
从以上两个方面出发，可以引申出设计网络的两个原则：第一，从定位的角度出发，应该采用全卷积的结构，去掉全连接层或全局池化层；第二，从分类的角度出发，应该采用较大的卷积核，使得像素与特征图的结合更加紧密，增强处理不同变换的能力，而且，一旦卷积核过小，造成感受野过小，覆盖不了较大的目标，不利于分类