yolo 中的anchor

最新推荐文章于 2024-06-23 17:04:45 发布

老哥稳咕咕咕

最新推荐文章于 2024-06-23 17:04:45 发布

阅读量579

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yuan14680/article/details/118571843

版权

yolo v3中的anchor是怎么计算的

在这里插入图片描述

p代表的是anchor，b代表的是预测框，而t是网络的真实输出，
即由网络的输出（t）计算出预测的框（b）
上图公式表示的实际是由网络的输出（t）解码到预测的框（b）的过程

编码：
对于真实的目标框，先归一化为（g_x，g_y，g_w，g_h），具体的归一化方法为，
g_x = （x_o/W）*13
g_y = （y_o/H）*13
g_w = （w_o/W）*13
g_h = （h_o/H）*13，
o下表代表原始的数据，归一化之后（g_x，g_y，g_w，g_h）的值都处于（0，13）的范围内

归一化之后进行编码，对于g_x，g_y的编码，只需要取小数部分即可，因为可以确定与回归的anchor在同一个格子中。对于g_w，g_h，需要与同样归一化操作的anchor进行对数运算
t ^g_x = g_x - g_x(floor)
t ^g_y = g_y - g_y(floor)
t ^g_w = log（g_w / p_w）
t ^g_h = log（g_h / p_h）
t ^g_x ，t ^g_y处于（0,1）之间

计算loss即计算网络的输出（t_x，t_y，t_w，t_h）和（t ^g_x，t ^g_y，t ^g_w，t ^g_h）之间的损失。
t代表一种偏移（offset）

解码：
在test中，网络的输出（t_x，t_y，t_w，t_h），根据上图中的公式即可以实际计算出预测框（b）

训练中的正负样本和ignore：
正样本：目标中心落在哪个格子中，计算那个格子的9个anchor中，与目标IOU最大的，该anchor负责预测这个目标
负样本：anchor与每个目标的IOU都小于阈值
ignore：IOU较大，当成负样本会影响结果，所以不参与计算

老哥稳咕咕咕

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
yolo 中的anchor

yolo v3中的anchor是怎么计算的p代表的是anchor，b代表的是预测框，而t是网络的真实输出，即由网络的输出（t）计算出预测的框（b）上图表示的实际是由网络的输出（t）解码到预测的框（b）的过程编码：对于真实的目标框，先归一化为（gx，gy，gw，gh），具体的归一化方法为，gx = （xo/W）*13gy = （yo/H）*13gw = （wo/W）*13gh = （ho/H）*13，o下表代表原始的数据，归一化之后（gx，gy，gw，gh）的值都处于（0，13）的范围内
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。