目标检测
文章平均质量分 71
目标检测相关知识
看山不是山a
在路上
展开
-
Faster Rcnn,ROI Pooling 与 ROI Align
由于建议框非常多,要对建议框进行初筛,先根据建议框是目标的分数,选出得分最高的前K个建议框,再进行NMS,然后再选出得分最高的前K个建议框。如一张照片有300个建议框。Feature Maps[bs,1024,38,38]经过3*3卷积,然后分别经过两个1*1的卷积,通道数分别为18,36。根据建议框的参数,在Feature Map上裁剪出对应特征,比如[1024,82,79],每个特征的大小是不一样的,36 = 9*4 代表每个位置9个先验框的坐标调整参数(Faster Rcnn也是有先验框的)原创 2023-09-12 10:08:15 · 262 阅读 · 0 评论 -
目标检测常见问题
长跳跃连接是指将不同层级的特征图进行融合的一种方法,可以帮助模型更好地捕捉不同层级的特征信息。众所周知,浅层特征图的细节信息丰富但语义信息较弱,深层特征图则与之相反。因此,在小目标检测中,可以将低层级的特征图和高层级的特征图进行融合,以增强对小目标的定位能力。③采用mosaic数据增强,四张照片缩放,拼接为一张。①将原始图像进行缩放,提高小目标样本数。(下采样,自底向上)等。②增加模型的输入尺寸。原创 2023-09-11 18:28:41 · 324 阅读 · 0 评论 -
图像检索,目标检测map的实现
如下图,该检索行人在gallery中有4张图片,在检索的list中位置分别为1、2、5、7,则ap为(1 / 1 + 2 / 2 + 3 / 5 + 4 / 7) / 4 =0.793;对于要预测的样本,比如说有7个真实框需要预测,预测框 预测框与真实框的iou大于阈值记为True,小于阈值记为Fasle,将他们按照类别置信度排序,如下图,然后选不同大小的类别置信度作为分界线。预测框先经过nms处理,然后计算TP,FP,FN。1.类别置信度选0.98,如图,此时TP = 1,FP=0,FN=7-1=6。原创 2023-08-22 22:19:55 · 1088 阅读 · 0 评论 -
yolo v3复现总结
对于预测的同一个种类,找出置信度最大的预测框,计算其他预测框与此预测框的iou,将iou大于给定阈值的其他预测框忽略。取出置信度最大的预测框,置信度为第二的则为首,计算此与其他iou,以此类推。如:网络输出为13x13对应的先验框为116,90, 156,198, 373,326相当于把一张图片分为13x13个cell(网格),每个网格比较大,所以匹配较大的先验框。计算iou,取iou最大的anchor,找到真实框的中心点所在的。置信度损失(交叉熵损失):计算正样本(1)和负样本(0)原创 2022-10-04 22:49:08 · 1094 阅读 · 0 评论 -
锚框(anchor box)/先验框(prior bounding box)概念以及yolov3中的使用
关于先验框,有的paper(如Faster)中称之为anchor(锚点),有的paper(如SSD)称之为prior bounding box(先验框),实际上是一个概念。在训练的时候往往是把先验框缩放到相对于特征图的大小,在推理时会把特征图上调整后的先验框,即预测框,放大到原图大小。原创 2022-09-15 00:09:10 · 4939 阅读 · 3 评论