【学习-目标检测】目标检测之——YOLO v3

背景

相比于faster rcnn,yolo的思想要直接的多。YOLO模型从2015年提出,一直采用单阶段的检测方式,在分块的特征上直接用anchor进行中心点和w、h的回归,得到最终的预测框和类别。各类改进版往往是吸取了两阶段检测和free anchor方法进行提升。

思路

YOLO-V1

在这里插入图片描述
根据特征图中网格划分寻找物体中心点并进行长、宽的拉伸,得到坐标框。

YOLO-V2

在这里插入图片描述
在yolo1的基础上,改进backbone,进行真实框的聚类(类似于rgb通道均值归一化),加入多尺度特征,得到更好结果。

YOLO-V3

在这里插入图片描述
yolo v3在之前的基础上融合了RPN的思想,通过提取特征生成anchor进行回归,比单纯学习更加快速高效;同时对于回归真实框部分:对于中心点回归使用sigmoid函数将距离控制在(0,1)之间,使用指数函数将w、h偏移控制在[0, +],更好的学习回归框的值。对于多个anchor重叠问题,使用score排序方式,去掉重复且分数低的框,但导致重叠物体难以检测。

结构

在这里插入图片描述

从整体结构来看,yolo v3的网络结构类似于faster rcnn的backbone和FPN结合的方式,提取出不同尺度的特征图,通过特征图(13\26\52)多尺度信息获得更多尺度目标,255=3*(80+4+1)对每个类别分别计算回归、分类和是否有物体的loss。
核心:粗定位用网格划分找到物体中心点,精定位用中心点和偏移框得到实际物体坐标。

细节

input:416x416x3
backbone:特征降维5次——13,降维4次——26,降维3次——52,分别得到三个尺度的特征输出(前一层特征作用到后一层)
回归:52x52x255(其中255表示(80类+4个坐标+是否有物体)*3个比例框
loss:
坐标转换:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

总结

  • yolo v3的anchor借鉴了RPN,多层特征输出和FPN类似,只不过不需要根据RoI进行特征解码之后再训练;
  • 在yolo v3提取多层特征之后,进行loss学习和转化是理解yolo 训练的关键,如何将1313225和26、52的
  • 特征转化为三个loss进行训练,还需要看代码更细致的理解。

但相比faster rcnn,yolo v3确实直接了当,先找真实框中心点,然后拉伸边界范围,最终用NMS过滤分数低和重复的候选框。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PyQt5可以用于搭建Yolo目标检测界面。你可以使用PyQt5的GUI开发框架来创建一个具有按钮和标签的窗口。当按钮被点击时,可以通过信号和槽机制来实现目标检测功能,并将结果显示在标签上。 首先,你需要导入PyQt5库,并创建一个继承自QtWidgets.QMainWindow的类。在这个类中,你可以定义界面的布局和组件,比如按钮和标签。你可以使用QtDesigner来设计界面,然后将生成的.ui文件转换为Python代码。 接下来,你可以在按钮的点击事件中调用目标检测的函数。你可以使用OpenCV库来进行目标检测,通过调用cv2.VideoCapture()函数来打开摄像头,并在每一帧上进行目标检测。然后,你可以将检测结果显示在标签上,可以使用cv2.cvtColor()函数将图像从BGR格式转换为RGB格式,然后使用QtGui.QImage和QtGui.QPixmap来显示图像。 最后,在关闭窗口时,你需要确保关闭多线程和已经打开的摄像头,以避免程序卡顿。你可以在closeEvent()函数中实现这个功能,通过调用terminate()函数来终止多线程,使用release()函数来释放摄像头。 综上所述,你可以使用PyQt5来搭建一个Yolo目标检测界面,通过信号和槽机制实现交互功能,并使用OpenCV库进行目标检测。 #### 引用[.reference_title] - *1* *2* *3* [睿智的目标检测——PyQt5搭建目标检测界面](https://blog.csdn.net/weixin_43293172/article/details/129465120)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值