目标检测(Object Detection)一直以来都是深度学习领域的热门话题,这个系列的文章会对其进行详细的梳理。
1. 目标检测是什么
- 图像分类任务回答的是"图像中的物体是什么"。而目标检测任务回答的是"图像中的物体是什么,它处于图像的什么位置"。
- 即,不但要输出目标所属的类别,还要输出物体的位置信息。位置信息通常采用bounding box表示,也就是给定一个矩形框的中心坐标以及宽高信息来定位框在图像中所属的位置。
2. 如何进行目标检测
- 从流程上进行分类一般有两种,即two-stage的方法和ont-shot的方法。
- two-stage的方法,也就是先产生候选区域,然后对每个候选区域进行分类,再通过回归来修正bounding box,最后通过非极大值抑制来确定最终的检测结果。
- one-shot方法的主要代表就是YOLO系列,它的思想是先将图片划分成一个个的单元格,然后对每个单元格进行处理,直接预测出当前位置是否存在物体、bounding box的位置以及分类的概率。
博主会持续更新一些人工智能领域的知识和实践、工作中遇到的问题和感悟、高效工作的方法和技巧,如果喜欢请关注、点赞、收藏支持~