目录
什么是预测框
预测框是目标检测算法根据图像特征和锚定框的信息,通过模型预测出的物体位置和尺寸。具体来说,预测框是算法根据锚定框(anchor box)和图像特征进行预测得到的物体边界框,包括预测的边界框坐标和类别概率。
怎么得到预测框
预测框(Prediction BBox)是通过目标检测算法得到的,它是对输入图像进行分类和定位的结果。在目标检测算法中,通常会预先设定一些锚定框(anchor box),这些锚定框是按照不同大小、宽高比例和长宽比等预设的矩形框。然后,算法会根据图像特征和锚定框的信息,通过模型预测出每个锚定框与实际物体的匹配程度,并生成相应的置信度和分类概率。
在预测时,对于每个锚定框,模型会选择一个与实际物体IOU最大的锚定框作为预测框,并生成相应的置信度和分类概率。置信度表示该预测框是否包含一个对象,分类概率表示该对象属于哪个类别的概率。同时,该预测框的位置和长宽比例也会根据实际物体的边框位置和长宽比例进行更新。
总之,预测框是通过目标检测算法对输入图像进行分类和定位的结果,它是根据锚定框和图像特征进行预测得到的物体边界框。
具体步骤
生成预测框
锚框的位置都是固定好的,不可能刚好跟物体边界框重合
需要在锚框的基础上进行位置的微调以生成预测框
预测框相对于锚框会有不同的 中心位置和 大小
预测框中心位置坐标
通过该方式生成预测框的中心坐标:bx=cx+σ(tx) , by=cy+σ(ty)
符号 | 含义 |
bx,by | 预测框的中心坐标 |
cx,cy | 小方块区域左上角的位置坐标 |
σ | Sigmoid函数 |
tx,ty | 预测框的中心坐标的微调系数 |
由于Sigmoid的函数值在0∼1之间:
预测框大小
锚框的大小是预先设定好的,在模型中可以当作是超参数
通过该方式生成预测框的大小:
符号 | 含义 |
bw,bh | 预测框的宽度、高度 |
pw,ph | 锚框尺寸 |
tw,th | 预测框的大小系数 |
如果,则预测框跟锚框重合.