目标检测:一张图中,把目标的所在位置框出来。
如果把这个任务用机器学习的方式做出来,是有监督还是无监督。可不可以把目标检测的任务当成回归的任务。如果把用框框出目标的任务当成回归的任务。确定一个框我们需4个值。(左上角和右下角),一个目标一个框,每个框有4个值。当有很多目标时,在回归任务中,很难确定输出层的节点个数。优点是框的大小很准确。缺点是框的个数很难确定。
当我们把目标检测的任务当成分类的任务时。我们用滑动窗口的做法。此时,窗口的大小很难确定(大目标和小目标)。但是可以把候选框传给分类器,所以,框的个数不用确定。
可见,回归和分类各有优劣。我们可以结合起来。把回归任务放到分类任务之后,前提是目标时(IOU)再进行目标框的回归。
分类和回归都是有监督的,都需要x和y。x是image图像,y是框的坐标和类别标签。