目标检测(yolo)中锚框的w和h用对数形式表示原因分析

最新推荐文章于 2024-05-14 17:36:28 发布

Mr.Liu's

最新推荐文章于 2024-05-14 17:36:28 发布

阅读量224

点赞数 1

文章标签：目标检测 YOLO 计算机视觉深度学习性能优化

本文链接：https://blog.csdn.net/qq_45305290/article/details/131116061

版权

目标检测(yolo)中锚框的w和h用对数形式表示原因分析

在阅读YOLO_v2的论文时，发现在计算锚框在图像原本位置的过程中，对t_w和t_h做了e的幂指运算（如图）。这说明这两个参数是按照对数形式保存的，可是为什么要这样呢？

理论上讲，对线性的尺度做了一次非线性变换应该是为了解决锚框尺度的问题。正如论文中处理不同大小锚框的偏移时可能会选择开根号或者直接用IoU的计算来代替绝对数值的计算。

YOLO将图像用规定大小和数量的网格划分开来，每个网格检测网格内部自己的目标。而且每个网格可能预不止一个锚框，表示可能存在的目标位置和尺寸。

如果用绝对的像素表示位置，对于不同尺度的目标不绝对公平。小目标与大目标相比，其坐标和尺寸的变化幅度可能很小，这样模型难以准确地预测小尺度目标。

如果用对数形式来表示宽高。即便是小尺度的锚框也拥有了和大尺度锚框差别不大的敏感度。

这样，大家遵循类似的分布，在训练时可能利于提高网络的性能以及回归收敛的速度。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Mr.Liu's

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
目标检测(yolo)中锚框的w和h用对数形式表示原因分析

用对数表示锚框宽高原因的分析
复制链接

扫一扫

目标检测YOLO实战应用案例100讲-改进YOLOX算法在小目标缺陷检测中的应用

qq_36130719的博客

10-27

942

根据观察所得和现有资料，小目标主要有以下几个特点：（1）边界框相对面积占比小在不同场景下对小目标的定义标准不尽相同，但现有的定义方式主要是以面积为衡量小目标的主要因素。由于小目标定义较多，且在实际环境中采集到的各种图像分辨率不固定，本文以相对尺度定义要研究的小目标对象，定义目标边界框面积与整幅图像比值0.004%~0.56%，如在640×640像素分辨率图像中，4*4像素到 48*48像素的目标可以考虑为我们需要检测的小目标对象。

目标检测YOLO实战应用案例100讲-基于深度学习的无人机目标检测算法轻量化研究

qq_36130719的博客

08-01

982

在Darknet深度学习框架支撑下，注重精度速度均衡化的YOLO系列算法结合新算法思想，不断推陈出新。而YOLO系列经典算法YOLOv3，继承了YOLOv1、 YOLO9000[ 61]算法精度高、推理速度块、检测种类多的优势，综合提高了各大尺度目标的检测精度，算法思想如下：(1) 基于残差网络构建的骨干网络Darknet53，基本模块为下采样和残差块的连续组合，详细结构见表2.1。下采样模块一方面可以降低网络计算量，另一方面也增大了感受野，提高对大目标的检测性能；

参与评论您还未登录，请先登录后发表或查看评论

基于keras的YOLOV3改变锚框数量代码操作

BillyPan的博客

05-21

1688

这里写自定义目录标题起因步骤参考起因原来师兄的毕设里面有提到过改变锚框的数量，但是没有具体的实现流程，然后导师想要我试试看这个的效果，如果效果好可以放在项目里。于是就改yolo的代码。记录一下防止忘记。注意：本文是将原有的9个anchors（每个尺度3个anchors）改为3个anchors(每个尺度1个anchors)。基于keras版本的代码：https://github.com/qqwweee/keras-yolo3 步骤 1.修改cfg文件找到yolov3.cfg,找到[yolo]，总共有

yolo中锚框问题

Newt_Scamander的博客

01-01

2163

anchors: [10,13, 16,30, 33,23] # P3/8 [30,61, 62,45, 59,119] # P4/16 [116,90, 156,198, 373,326] # P5/32 这里的每一行代表一个尺度下的三个锚框，比如第一行是stride=8时的三个锚框，分别为1013，1630，33*23时比较适合检测小目标的尺度。 ...

锚框(anchor box)/先验框(prior bounding box)概念以及yolov3中的使用

weixin_62848630的博客

09-15

5035

关于先验框，有的paper(如Faster)中称之为anchor(锚点)，有的paper(如SSD)称之为prior bounding box(先验框)，实际上是一个概念。在训练的时候往往是把先验框缩放到相对于特征图的大小，在推理时会把特征图上调整后的先验框，即预测框，放大到原图大小。

结合具体代码理解yolov5-7.0锚框（anchor）生成机制

qq_44442727的博客

06-19

6229

在yolov5s中，anchors是通过register_buffer()函数把预设的锚框尺度信息作为参数注册到最后的Detect网络层中。因为目标的位置信息是锚框参数乘以特征图数据得到，所以网络预测的是一种相对锚框的位置信息，可以理解成是锚框的位置偏移量，网络通过学习预设锚框针对目标的位置偏移量来实现目标的类别识别和位置预测。

YOLOv3学习——锚框和候选区域

pidzhengding的博客

02-08

9257

YOLOv3学习之锚框和候选区域单阶段目标检测模型YOLOv3 R-CNN系列算法需要先产生候选区域，再对候选区域做分类和位置坐标的预测，这类算法被称为两阶段目标检测算法。近几年，很多研究人员相继提出一系列单阶段的检测算法，只需要一个网络即可同时产生候选区域并预测出物体的类别和位置坐标。与R-CNN系列算法不同，YOLOv3使用单个网络结构，在产生候选区域的同时即可预测出物体类别和位置，不需要分成两阶段来完成检测任务。另外，YOLOv3算法产生的预测框数目比Faster R-CNN少很多。Faster

目标检测YOLO实战应用案例100讲-基于深度学习的无人机图像自适应分簇目标检测方法

qq_36130719的博客

08-21

299

卷积是信号处理中重要的技术，在深度学习的领域，经典的卷积神经网络正是基于信号中卷积的概念而被提出。卷积的本质是两种信号的互相关，信号领域卷积的定义如式（2.1）：卷积可以用以下过程描述：首先，两个函数中的其中一个进行反转；然后，再对其进行移位并与另一个函数相乘叠加，得到卷积结果。即卷积反映的是两个函数全局的关系，f函数看作是输入函数，式（2.1）等号右侧的表达式看作是输出函数，则g 可以看作是某个系统函数，卷积过程本质上是对数据的一种编码处理。

目标检测YOLO实战应用案例100讲-基于深度学习的自动驾驶目标检测算法研究

qq_36130719的博客

05-18

1180

近年来，随着人工智能技术以及车载感知器件的快速发展，国内外许多传统汽车企业与互联网巨头强强联手，开始在自动驾驶的战场上布局。如图1-1所示,百度、特斯拉、谷歌以及华为等科技公司已经在自动驾驶领域取得了阶段性的进展。谷歌公司早在2010年就开始了自动驾驶的研究工作，目前的自动驾驶安全行驶距离已经超过14万英里；特斯拉则在自动驾驶商业化方面取得成绩优异，2020年，配有“完全自动驾驶”的汽车年销量已经超过60万。国内自动驾驶技术。

目标检测YOLO实战应用案例100讲-基于毫米波雷达与摄像头协同的道路目标检测与识别

qq_36130719的博客

08-22

1197

自动驾驶技术主要依靠人工智能与多源信息协同处理[ 5]。在面对错综复杂的道路环境时，智能汽车一般搭载多个传感器，收集不同传感器获取的环境及障碍物信息，分析对自身行车有威胁的道路目标从而进行有效决策，控制车辆以避免发生碰撞。因此这些不同质传感器的协同检测结果将直接影响后续的规划决策与车辆控制。环境感知作为自动驾驶极其重要的一环，所使用的主流传感器有毫米波雷达、超声波雷达、红外线传感器、摄像头以及激光雷达等。不同传感器都有各自优缺点。

YOLO-先验框/anchor(锚点)

_____

12-12

3290

什么是Anchor？

YOLOv4-tiny（三）锚框解码

最新发布

Wexssss的博客

05-14

1652

本期讲一下关于YOLOv4-tiny中锚框解码和模型评估部分的内容。对于想了解非极大值抑制的过程、以及预测结果如何转换到图片上的真实预测框的可以参考。

记录一下yolov7自定义计算锚框

wangasdf1的博客

06-11

2154

自动计算时，会自动根据你所使用的数据集，来计算合适的阈值。path：包含数据集文件路径等相关信息的 yaml 文件（比如 coco128.yaml），或者数据集张量（yolov5 自动计算锚定框时就是用的这种方式，先把数据集标签信息读取再处理）其中，9代表聚类出9种锚框，640代表默认的图片大小，5.0表示数据集中标注框宽高比的最大阈值，1000代表kmean聚类算法迭代计算1000次。接下来，重新运行，使用yolov7.pt预训练，网络架构使用yolov7-tiny.yaml，运行100轮，

YOLOV3代码学习--util锚框回归

fanfou_的博客

08-30

200

repeat每次在前面添加一个维度，batch_size*len(self.anchor_mask[i])使用view拆成batch_size,len(self.anchor_mask[i])三维变成四维度。repeat在w,h生成第三维度，每张图片的三个先验框先确定出尺寸相同为scaled_anchor。）的高级索引操作，可以用于在多维数组的任何维度上进行索引。在本例中，最后一个维度是。[6,7,8][1,2,3][4,5,6]为三种特征层锚框序列。，表示每个样本、每个先验框在属性维度上的第一个属性。

Pytorch机器学习（九）—— YOLO中对于锚框，预测框，产生候选区域及对候选区域进行标注详解

lzzzzzzm的博客

10-06

1万+

Pytorch机器学习（九）—— YOLO中锚框，预测框，产生候选区域及对候选区域进行标注目录 Pytorch机器学习（九）—— YOLO中锚框，预测框，产生候选区域及对候选区域进行标注前言一、基本概念 1、边界框（bounding box） xyxy格式 xywh格式 2、锚框（anchor box） 3、预测框（predictionbox）中心目标生成长宽生成 4、对候选区域进行标注 objectness标签 location标签 label标签 .

【Yolov系列】Yolov5学习（一）补充1.2：自适应锚框计算详解+代码注释

qq_43737512的博客

04-19

2598

①获取数据集中所有目标的宽和高。②将每张图片中按照等比例缩放的方式到 resize 指定大小，这里保证宽高中的最大值符合指定大小。③将 bboxes 从相对坐标改成绝对坐标，这里乘以的是缩放后的宽高。④筛选 bboxes，保留宽高都大于等于两个像素的 bboxes。⑤使用三方得到n个 anchors，与YOLOv3、YOLOv4 操作一样。⑥使用随机对 anchors 的宽高进行变异。倘若变异后的效果好，就将变异后的结果赋值给 anchors；

【YOLO】yolov5的训练策略2 -- 自动锚框autoanchor

AI学长

07-13

3324

在yolov5 中训练开始前，计算数据集标注信息针对默认锚定框的最佳召回率，当最佳召回率大于等于0.98时，则不需要更新锚定框；如果最佳召回率小于0.98，则需要重新计算数据集的锚定框，如果计算处理更好则更新原理的anchors。

yolov5目标框预测