注意力机制、损失函数、可变性卷积和神经网络的学习记录

麦辣翅翅

已于 2024-03-18 13:59:30 修改

阅读量1k

点赞数 24

文章标签：神经网络学习人工智能

于 2024-02-29 14:54:45 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_69334152/article/details/135832307

版权

本文探讨了注意力机制在深度学习中的应用，如空间注意力和通道注意力，以及SEnet和CBAM的作用。重点介绍了Focalloss等优化的损失函数，包括IoU系列损失和DCNv2的可变性卷积。此外，还提及了神经网络技术NERF及其在3D重建中的应用。

摘要由CSDN通过智能技术生成

注意力机制

让网络关注到我们所需要关注的地方

空间注意力机制

在图片的哪个位置更重要

通道注意力机制

通道层次上哪个特征更为重要（比如点、线、明暗、色域等等）

SEnet

通道注意力机制
经过全局平均池化，全连接层，通过SIGMOD函数值0-1 与原矩阵相乘

CBAM

在这里插入图片描述

先通过通道注意力模块，和原矩阵相乘；再通过空间注意力模块，和原矩阵相乘，最后输出

以下是两个模块
在这里插入图片描述感悟：就是分别在通道和空间上进行池化操作，得到一个权重与原矩阵相乘，让网络更加关注我们所需要的位置；我认为主要是池化层可以让网络自适应注意（max、avg）。

损失函数

focal loss

交叉熵

在这里插入图片描述

p ——真实值
q——预测值

就是将预测结果与真实标签进行对比计算，值越小，预测越准确，完全正确就是0.

二值交叉熵损失（Cross Entropy Loss）

在这里插入图片描述

focal loss

在这里插入图片描述
引入调制因子，用于平衡正负样本。（跟WIOU很像）

IoUloss

在这里插入图片描述

交并比
再取负对数
优点：尺度不变性；非负性，在0-1之间。
缺点：不能正确反映两者的重叠情况和距离情况。

GIOUloss

在这里插入图片描述 C（外框）

优点：增加外框做为惩罚项。
缺点：当预测在真实框之内，giou退化为iou。

DIoUloss

在这里插入图片描述
两框中心的欧式距离比上外框对角线距离
优点：可以有效度量，改进了giou的缺点；使用中心点距离度量，收敛比giou更快。
缺点：在长宽比上面还需要改善。

目标框回归损失应该考虑三个比较重要的几何因素：重叠面积、中心点距离、长宽比。

在这里插入图片描述
其中alpha和v用来衡量宽高比的一致性。

所以CIoUloss是结合了中心距离度量和宽高比。

WIoUloss

在这里插入图片描述
首先WIoUv1，构建了上图的度量方式。
这样的优点是，避免了距离、纵横比等方式导致对低质量锚框的惩罚，放大了低质量锚框的影响，平衡了低质量与高质量锚框。

在这里插入图片描述
在v3中，定义了离群度，其中LIoU就是当前的一个损失值，也叫单调聚焦系数。

根据离群度定义了非单调聚焦系数，离群度小的分配一个小的梯度增益，这时的高质量锚框就减少对他的一个惩罚，让模型聚焦于普通质量的锚框；离群度大的分配一个较小的梯度增益，有效得对低质量锚框进行惩罚。
动态体现在离群度上，分母会动态更新，使梯度增益保持在较高水平。

所以WIoUv3是设计了一个动态非单调聚焦机制，合理得分配了梯度增益。

这样修改可以提高模型的泛化能力。
泛化能力：泛化能力是指机器学习模型在处理新样本时的表现能力。

DCNv2可变性卷积

在这里插入图片描述

在原来的可变性卷积基础上增加了两点，首先，增加一个可以学习的参数delta P，使得卷积核可以变形；其次增加了一个权重，让卷积核变形范围不超过目标范围。

增加一个参数让卷积可以变形，使得模型更加适应不同的几何形状。

nerf（Neural Radiance Fields）神经网络

1、拍摄得到一系列的图片（数据集）；
2、输入密度与颜色进行神经网络训练，得到空间中密度与颜色的分布；
！这里用到了位置编码，（x，y，z，sin(2^n-1*x)，…）
3、要得到从某一个角度看过去的颜色情况，
连续：积分
在这里插入图片描述
离散：代码里用的公式
这样就可以得到从不同角度看到的照片
（1）可以用英伟达开源的图形化操作程序。
（2）围绕拍摄一段视频，工具直接得到切割的图片和相机参数信息，拖入程序运行，得到三维模型。
（3）评价指标：PSNR：峰值信噪比。

关注

24
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
注意力机制、损失函数、可变性卷积和神经网络的学习记录

注意力机制、损失函数、可变性卷积和神经网络的学习记录
复制链接

扫一扫

麦辣翅翅 CSDN认证博客专家 CSDN认证企业博客

码龄2年

4: 原创

77万+: 周排名

18万+: 总排名

2921: 访问

: 等级

98: 积分

47: 粉丝

56: 获赞

5: 评论

48: 收藏

私信

关注

热门文章

最新评论

线性代数、概率论和高数学习记录
CSDN-Ada助手: 恭喜用户在博客中记录了线性代数、概率论和高数的学习过程，这些是非常重要的数学基础知识，相信对您的学习和成长都会有很大帮助。希望您能继续坚持创作，分享更多的学习心得和体会，或许可以加入一些具体的案例分析或实际应用，让读者更易于理解和吸收知识。期待看到您更多的精彩内容，加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
旧版本YOLOv8代码修改
麦辣翅翅: 训练效果是需要多尝试的最新版本我没有修改不过旧版本修改后的代码我已经发出来了可以点击视频链接去看看
旧版本YOLOv8代码修改
zzh-anchor: 按博主的方法在1.0版本上去修改添加注意力机制是没问题的，可以添加成功，但是就是训练的效果不好
旧版本YOLOv8代码修改
zzh-anchor: 你好，请问v8现在的1.0版本你有修改过损失函数吗，我用你的方法在1.0版本上修改损失函数后去训练会报File "/home/wood/PycharmProjects/ultralytics-main/ultralytics/utils/tal.py", line 125, in iou_calculation return bbox_iou(gt_bboxes, pd_bboxes, xywh=False, EIoU=True).squeeze(-1).clamp_(0) File "/home/wood/PycharmProjects/ultralytics-main/ultralytics/utils/metrics.py", line 181, in bbox_iou inter = (torch.min(b1_x2, b2_x2) - torch.max(b1_x1, b2_x1)).clamp(0) * \RuntimeError: The size of tensor a (4) must match the size of tensor b (9283) at non-singleton dimension 0这个错误，请问你知道该怎么解决吗
目标检测学习记录
CSDN-Ada助手: 恭喜你开始了博客创作，标题为“目标检测学习记录”听起来很有意思！希望你能够坚持下去，分享更多关于目标检测的学习心得和经验。我建议你可以在接下来的博客中加入一些具体的案例分析或者实际操作经验，这样可以让读者更加深入地了解你的学习过程。加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。