YOLO个人理解笔记1

YOLOV1:
网络结构可以看作一个黑箱子
在这里插jiegoutu入图片描述

输入图片大小为4484483,3是图片三通道,RGB三个通道,
输出图片为7730,7*7指的是图片大小,30可以写成((1+4)*2+20),1指的是置信度,4指的是bounding box 的四个位置参数x,y,h,w(坐标和宽高),2指的是每一个grid cell会生成两个bounding box,20指的是yolov1所用的数据集总共有20个预测的类别。

在这里插入图片描述

解释:
grid cell 指的是每一个输入的图片,会被划分为7*7的网格,每一个网格就叫grid cell
bounding box指的是框,每一个grid cell在yolov1中会产生两个bounding box

在yolov1中预测后处理bounding box的方法采用的NMS非极大值抑制法
经过“黑箱子”后,图片是7730的一个tensor,每一个grid cell负责预测一个物体,所以yolov1最多预测77个物体,也是v1的缺点,
取出一个1
130的张量,用20中的每一个类别的概率去分别与每个bounding box 的置信度参数相乘,最后会得到(27*7,20)的一个张量。
非极大值抑制,不是极大值就会被抑制
单独看一个类别,会得到一个98个概率。然后第一个概率和后面依次进行比较,非极大值抑制需要一个参数M,只有iou大于参数M,也就就是实际框和预测框的交并比大于参数M(也就意味着两个框预测的是同一个物体的概率比较,调节参数M,M设置的大,准确率高),两个概率里面小的概率会被置为0,然后依次与后面进行比较。20类一共进行20次NMS操作。

yolov1缺点:
只能检测出49个物体,导致了小目标和密集目标检测效果差
map低
定位能力差
全部物体检出能力差

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值