YOLO2论文的概括理解

论文名称:YOLO9000: Better, Faster, Stronger

论文地址:https://arxiv.org/abs/1612.08242

在yolo所有的卷积层后面添加BN层,基网络采用darknet-19

采用anchor,最后一层卷积层的特征尺寸是13*13,每一个特征点预测5个anchor,faster里面的9个anchor是人为选择的出来的,yolo里面的5个是聚类聚出来的,这一点也是我觉得YOLO2最有意思的一点。

YOLO2采用的聚类的算法就是k-mean,要进行聚类就要解决两个根本问题:1、聚类的特征是什么?2、距离度量的标准是什么?YOLO2的聚类特征是根据训练数据集里面标定的bounding box,论文里面的原画是dimensions of bounding box(根据论文里面的图我猜测是bounding box的中心点还有长宽,具体是什么要需要看源码才知道)。距离度量的公式是

                                                                          d(box,centoid)=1-IOU(box,centoid)

这里的聚类不是事先指定k的大小,然后再聚类,而是根据聚类的结果选择k具体是多少,如图将指定k为1-15,对每一个k聚类,计算聚类完成以后的avg IOU。得到k与avg IOU大小的关系,最后选择曲线肘部处的k对应的值作为k的大小。

YOLO2第二个我觉得很有意思的就是他的细粒度特征,26x26x512的特征图叠加成13x13x2048的特征图,与原来的特征图相连接在一起。

具体请看原文。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值