这篇文章对YOLO V3的介绍已经非常到位了,这里再稍微补充一下
- 考虑到要分类的各个类别并不是完全独立的(例如woman和person),YOLO V3并未采用softmax完成最后的分类,而是训练N个logistic分类器,分别完成每个类别的分类。具体讲,对每个得到的bbox,我们自然可以依据其于groundtruth的IoU判定bbox的标签,同时,网络最终得到一个长度为80(coco的类别)的向量,也就是说,有多少个bbox,就有多少个长度为80的向量,同时知道每个向量的label,然后就可以训练得到该类的logistic分类器。