YOLO v2(yolo9000)

主要是提出了一系列方案来提升yolo v1的效果。
就如他论文题目一样,yolo v2分别让yolo v1变得更好,更快和更强。

更好, 更快

  1. 使用了batch norm,来约束神经元的输出,从而使模型更容易收敛。
    2.使用了高分辨率的分类器:先在imagenet上训练低分辨率图的分类,再在高分辨率图上训练分类,再去训练检测
    3.使用了anchor boxes:v1中每个小方块只有对应的2个bbox,而且是随机大小,随机位置的。而v2中每个小方块有5个bbox,而且大小是ground truth聚类的结果,因此更容易拟合图片。另外,v2对于bbox的中心点做了sigmoid,从而保证所有的bbox中心点都无法偏离当前方块。
    4.使用了新的网络(darknet19)减少了计算量
    5.加了pass through层:将一个大图拆分成多通道的小图,然后和直接卷积的结果拼接,从而让模型融合底层和高层信息
    6.使用了多尺度训练:输入不同尺度的图像,使用global average pooling还原为同一尺度。GAP就是对同一通道的所有值求均值,然后输入下一层,因此不会被尺度影响。
    7.使用了高分辨率的图片作为输入
    8.用了更细的网格(1313),v1中是77

更强

联合训练Imagenet和coco,因为imagenet是有几万个类别的,而coco只有80个,所以如果可以借用imagenet里的类别信息,那么就可以学会几万个类别的分类了。
但是由于imagenet里的类别和coco的类别并不是互斥的,例如,coco中的“狗”,在imagenet里可能有金毛,有哈士奇。但一般而言,分类器都是互斥的,将不同类别拉的越远越好,因此简单的联合训练是行不通的。所以他借用了wordnet中的层次结构,将不同类别分层,不同层之间做分类,也即狗和猫分类,哈士奇和金毛分类。但是最终效果似乎一般。

参考链接:https://www.bilibili.com/video/BV1Q64y1s74K

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
.版本 2 .程序集 自动瞄准子程序 .程序集变量 人物位置, 整数型 .程序集变量 当前选中, 整数型 .子程序 自动瞄准 .参数 HOOK1, 整数型 .参数 HOOK2, 整数型 .参数 HOOK3, 整数型 .参数 HOOK4, 整数型 .参数 HOOK5, 整数型 .局部变量 i, 整数型 .局部变量 敌人坐标数据x, 双精度小数型 .局部变量 敌人坐标数据y, 双精度小数型 .局部变量 敌人坐标数据z, 双精度小数型 .局部变量 本人坐标数据x, 双精度小数型 .局部变量 本人坐标数据y, 双精度小数型 .局部变量 本人坐标数据z, 双精度小数型 .局部变量 D3D距离, 小数型 .局部变量 最近距离, 小数型 .局部变量 X角度, 双精度小数型 .局部变量 Y角度, 双精度小数型 .局部变量 人物地址, 整数型 .局部变量 人物一级, 整数型 .局部变量 敌人基址, 整数型 .局部变量 X差距, 双精度小数型 .局部变量 Y差距, 双精度小数型 .局部变量 Z差距, 双精度小数型 .局部变量 敌人阵营, 整数型 .局部变量 敌人视角, 小数型 .局部变量 临时位置, 整数型 .局部变量 敌人数量, 整数型 人物地址 = 汇编_读整数型 (#人物基址) .如果真 (人物地址 > 0) .如果真 (汇编_读整数型 (#本人死亡基址) = 1) 敌人数量 = 取显示人物数量 () .判断开始 (敌人数量 = 8) 人物一级 = 汇编_读整数型 (人物地址 + #坐标一级) 本人坐标数据x = 汇编_读小数型 (人物一级 + 224) 本人坐标数据z = 汇编_读小数型 (人物一级 + 228) 本人坐标数据y = 汇编_读小数型 (人物一级 + 232) 敌人阵营 = 1 - 汇编_读整数型 (#阵营基址) .如果真 (当前选中 < 8 且 汇编_读整数型 (#本人位置) < 8) 当前选中 = 255 .如果真结束 .如果真 (当前选中 > 7 且 汇编_读整数型 (#本人位置) > 7) 当前选中 = 255 .如果真结束 .如果真 (当前选中 = 255) 最近距离 = 0 临时位置 = 255 .计次循环首 (8, i) 人物位置 = i - 1 + 敌人阵营 × 8 敌人基址 = 汇编_读整数型 (#敌人基址 + 人物位置 × #坐标基址规律) .如果真 (汇编_读整数型 (敌人基址 + #是否死亡偏移) = 1) 敌人坐标数据x = 汇编_读小数型 (敌人基址 + #坐标X偏移) 敌人坐标数据z = 汇编_读小数型 (敌人基址 + #坐标Z偏移) 敌人坐标数据y = 汇编_读小数型 (敌人基址 + #坐标Y偏移) D3D距离 = 取3D坐标距离 (本人坐标数据x, 本人坐标数据y, 敌人坐标数据x, 敌人坐标数据y) .如果真 (最近距离 = 0) 最近距离 = D3D距离 临时位置 = 人物位置 .如果真结束 .如果 (D3D距离 < 最近距离) 最近距离 = D3D距离 临时位置 = 人物位置 .否则 .如果真 (i = 8) 临时位置 = 人物位置 .如果真结束

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值