CV领域中目标检测的成果。
You Only Look Once: Unified, Real-Time Object Detection
此前的研究都是将目标检测看作分类问题,本文创新地将目标检测看作回归问题。
写了半天,发现这篇文章作为经典之作,前人已有很好的解读了。自惭形秽之下,决定直接引用别人的文章。
- https://zhuanlan.zhihu.com/p/31427164
- https://blog.csdn.net/u010167269/article/details/52638771
相较之下,第一篇解读更加透彻,但第二篇会有一些第一篇不涵盖的细节。
把检测转化为回归问题的思路倒是可以参考。
YOLOX: Exceeding YOLO Series in 2021
是YOLO的改进,今年的最新成果,由旷视发表。旷视果然是在这一方面领先的企业。
使用一些最新的技术对YOLO进行改进,如decoupled head和SimOT标签分配策略,并且使其做到了anchor-free。
文中针对每一个环节都有改进的考量,在改进网络时或许可以参考。
关于anchor,anchor-based 的方法由于依赖先验的anchor,会存在一定的误差。不过,anchor有利于小物体检测。并且,从目前的趋势看,anchor-based和anchor-free的方法是一个“轮回”,交替出现,或是融合。这也许会是一个方向。