多次霸榜CVPR最新idea-损失函数+注意力机制

AI科技探寻

于 2025-03-07 10:30:00 发布

阅读量1k

点赞数 10

CC 4.0 BY-SA版权

文章标签：人工智能深度学习 lstm 计算机视觉 rnn

本文链接：https://blog.csdn.net/d22800/article/details/146063671

在深度学习领域，损失函数和注意力机制的结合已经成为一种重要的研究方向。这种结合能够显著提升模型的性能和泛化能力，帮助模型更精确地捕捉数据中的关键信息，同时减少不必要的计算消耗

今天就损失函数+注意力机制整理出了论文+开源代码，以下是精选部分论文

更多论文料可以关注：AI科技探寻，发送：111 领取更多[论文+开源码】

论文1

方法：

创新点：

多尺度注意力机制：通过在多个尺度上提取注意力掩码并聚合信息，模型能够学习更具判别力的特征表示，从而提升分类性能。
加权焦点损失函数：与传统的二元交叉熵损失相比，加权焦点损失函数能够更好地处理类别不平衡问题，同时关注难以分类的样本，从而提高模型的准确率。
注意力损失函数：通过惩罚具有高预测方差的注意力掩码，有效解决了注意力机制在弱监督条件下的不稳定性问题，进一步提升了模型的性能。
性能提升：在WIDER-Attribute数据集上，该方法的平均精度（mAP）达到了86.4%，比之前的最佳方法提高了1.3个百分点；在PETA数据集上，F1分数达到了86.46%，比之前的最佳方法提高了1.7个百分点。

关注你的损失函数：理解关于1-Lipschitz神经网络的误解

方法：

创新点：

鲁棒性与准确性统一：证明1-Lipschitz网络在保持高准确性的同时，能够提供鲁棒性半径证书，解决了以往认为鲁棒性与准确性相互矛盾的观点。
损失函数的关键作用：揭示了损失函数的超参数（如温度参数τ）在控制网络准确性和鲁棒性权衡中的关键作用，为网络训练提供了新的视角。
泛化能力提升：与无约束网络相比，1-Lipschitz网络在训练集规模增加时，训练损失能够更好地逼近测试损失，从而具有更强的泛化能力。
性能提升：在CIFAR-10数据集上，通过调整损失函数的超参数，1-Lipschitz网络能够达到与无约束网络相当的准确率，同时具有更高的鲁棒性。
PAC学习理论应用：为1-Lipschitz网络提供了PAC学习理论支持，证明了在适当选择边际参数m的情况下，网络的VC维度是有限的，从而确保了网络在大样本情况下的学习能力。

基于损失函数的深度多实例学习注意

方法：

创新点：

性能提升：在多个基准数据库上，所提方法在包分类和图像分类任务上优于现有的最先进的多实例学习（MIL）方法。例如，在MUSK1数据集上，分类准确率达到了91.7%，比之前的最佳方法提高了约2.8个百分点。
实例权重与损失的直接联系：首次直接将注意力机制与损失函数连接起来，用于多实例学习，使得实例权重的计算更加直接和有效。
提升实例召回率：通过引入正则化项，显著提升了实例的召回率。实验结果表明，与仅使用softmax和交叉熵函数的注意力机制相比，所提方法能够更好地识别出与包标签一致的实例。
平滑训练过程：一致性代价的引入有效平滑了训练过程，使得模型在训练过程中更加稳定，从而提高了模型的泛化能力。

方法：

创新点：

性能提升：在多个数据集上的实验表明，MTAN在多任务学习中达到了最先进的性能。例如，在NYUv2数据集上，与Cross-Stitch网络相比，MTAN在语义分割任务上的mIoU（平均交并比）提升了约3.2个百分点，在深度估计任务上的绝对误差降低了约0.014。
参数效率：MTAN通过共享全局特征池和注意力掩码自动学习特征共享，相比其他多任务学习方法，参数数量显著减少，例如在SegNet基础上实现MTAN时，参数增加量不到10%。
对权重方案的鲁棒性：MTAN对多任务损失函数中的权重方案具有更高的鲁棒性，避免了繁琐的权重调整过程。实验表明，MTAN在不同的权重方案下都能保持相似的学习趋势。
任务特定特征学习：通过注意力模块，MTAN能够为每个任务学习特定的特征，使得模型在处理复杂任务时更加灵活和高效。