特征融合新技术——自适应特征融合！高效又涨点！

最新推荐文章于 2025-04-20 22:43:03 发布

AI科技探寻

最新推荐文章于 2025-04-20 22:43:03 发布

阅读量3.8k

点赞数 37

文章标签：人工智能机器学习数据结构时序数据库

本文链接：https://blog.csdn.net/d22800/article/details/145627460

版权

自适应特征融合（Adaptive Feature Fusion，AFF）是一种深度学习中的特征处理技术，它通过动态调整特征融合过程来提高模型的泛化能力和性能表现，今天分享的就是关于自适应特征融合的论文解读。

我还整理出了相关的论文+开源代码，以下是精选部分论文

更多论文资料可以关注：AI科技探寻领取相关[论文+开源码】

论文1

标题：

Feature Fusion Transferability Aware Transformer for Unsupervised Domain Adaptation

方法：

特征融合（Feature Fusion, FF）：在潜在空间中融合嵌入，使每个嵌入能够整合同一批次中其他嵌入的信息，从而提高泛化能力。
Transformer架构：基于Vision Transformer（ViT），将图像分割为固定大小的非重叠块，并将这些块投影到潜在空间中作为patch tokens，结合位置嵌入后输入Transformer层。
领域自适应训练：使用源域和目标域的图像进行训练，通过领域判别器和patch判别器来评估特征的可转移性，并利用自聚类模块和分类器头分别对目标域和源域图像进行优化。

创新点：

可转移性图引导的自注意力（TG-SA）：通过强调高度可转移特征之间的连接，显著提高了模型在无监督领域自适应任务中的性能。
特征融合（FF）：通过在潜在空间中融合特征，提高了模型对噪声的鲁棒性和泛化能力。在Visda-2017数据集上，FFTAT平均准确率达到了93.8%，相比不使用FF的方法提升了9.3%。
Transformer架构的改进：将Transformer架构应用于无监督领域自适应任务，相比传统的CNN架构，FFTAT在多个基准数据集上均取得了显著的性能提升。
动态学习可转移性图：FFTAT能够动态学习可转移性图，从而更好地识别和利用跨领域的可转移特征，进一步提升了模型的适应性和性能。

标题：

Learning Feature Fusion for Unsupervised Domain Adaptive Person Re-identification

方法：

创新点：

特征融合模块（FM）：通过自适应学习融合全局和局部特征，避免了多伪标签学习中的模糊性问题。
多视图特征学习：通过教师-学生框架学习多视图特征，显著提高了模型对目标域的适应能力。在DukeMTMC-ReID到Market1501的实验中，LF2方法Rank1准确率提升了1.7%，达到92.8%。
伪标签优化：通过多级聚类生成多样化的伪标签，提高了伪标签的可靠性，从而提升了模型的性能。
细粒度特征学习：通过学生网络的局部特征图，LF2能够更好地关注行人的重要局部信息（如衣服、背包等），从而提高了特征表示的全面性

论文3

标题：

方法：

自适应空间特征融合（ASFF）：提出了一种新颖的数据驱动策略，用于金字塔特征融合，通过学习空间过滤冲突信息来抑制不同特征尺度之间的一致性问题，从而提高特征的尺度不变性。
特征金字塔网络（FPN）：基于YOLOv3的特征金字塔结构，通过自适应空间特征融合策略，增强特征金字塔的表示能力。
特征重缩放与融合：将不同尺度的特征图重缩放到相同分辨率后进行自适应融合，通过学习权重图来决定不同尺度特征的贡献。

创新点：

自适应空间特征融合（ASFF）：通过自适应学习空间权重，解决了特征金字塔中不同尺度特征之间的一致性问题，显著提升了模型对多尺度目标的检测能力。
性能提升：在保持高效率的同时，ASFF显著提升了YOLOv3的性能，使其在COCO数据集上达到了43.9% AP（29 FPS），成为单次检测器中的SOTA。
计算效率：ASFF在推理时几乎不增加额外的计算开销，仅增加了2 ms的推理时间，保持了模型的高效率。
通用性：ASFF对不同的主干网络和单次检测器具有通用性，可以方便地应用于其他基于特征金字塔的检测器，如RetinaNet，同样取得了显著的性能提升