5.20自适应融合笔记-CSDN博客

本文链接：https://blog.csdn.net/weixin_43900988/article/details/117111763

5.20自适应融合笔记

围绕鲁棒性去思考；为什么鲁棒性差
各类数据的缺陷是什么
现在有两条思路：1.特征图的交叉：如何可以思考感受野，感受野上的互补，RCNN如何选框的，可以用同样的方法融合框，最主要是找到本质；2.数据源上的互补，RGB和PTS如何弥补，去阅读乱嗯
感受野的弥补可不可以改善框的回归问题

任务：1.学习感受野(完成)；2.把融合论文读完；3.什么是金字塔

基于信道交换的深度多模态融合

aggregation-basedfusion,alignment-basedfusion, and the mixture of them

关键点：无参数、信道交换

使用BN中的scaling factor度量通道重要性，然后将0的通道用双模态均值代替

由于深度学习的成功，目前所指的多模态融合大多数都是基于端到端的神经网络。对于现有的这些方法，按照如何进行多模态融合的方式，可以分为以下几种:基于聚合的融合方式(aggregation-based fusion)和基于对齐的融合方式(alignment-based)，以及将两种方法进行结合的方式

感受野：当盯着某个点看的时候，只有该点是清晰的其他区域都是模糊的，只有眼球不停转动的时候才能连续看清不同的区域。特点：视野大，关注中点，需要转动。

定义：在深度卷积神经网络中，每个神经元节点都对应着输入图像的某个确定区域，仅该区域的图像内容能对相应神经元的激活产生影响。1.越靠近感受野的中心区域越重要，各向同性（距离感受野中心位置相等的区域重要程度一致），由中心向周围的重要性衰减速度可以通过网络结构控制。

神经网络感受野看到的图像有可能比原始图像还要大，因为神经网络中pad步骤进行了补0，所以多出来的是黑边（ResNet）

感受野如何计算：

可以改变感受野大小的操作：卷积层，池化层，反卷积操作（转置操作），残差连接（ResNet），合并连接
不可以改变：非线性激活，BN，GN
感受野大小和中心：感受野是逐层累积得到的；感受野的增速直接和卷积、步长累乘相关，想要网络快速达到某个感受野尺度可以让步长大于1的卷积核更靠前，还可以同时大大增加网络的推理速度，因为特征图分别率会迅速变小；中心计算公式也有

有效感受野：