【计算机视觉】如何用传统方法在实现目标检测?
问题描述
深度学习虽然很火热,但是数据量不大的时候,深度学习的性能还是比较差的,最主要的是模型能力太强,学出来之后不能泛化,因此一种可选的方法就是 不要处处都是深度模型,试试返璞归真的传统方法
。
传统方法
基本上传统机器方法最直观的就是分类、回归,而对于计算机视觉中级任务:目标检测
该如何下手呢?一种最直观的想法就是用滑动窗口 sliding window
的方法,对滑动窗口内的图像块儿进行分类,根据滑动窗口的位置得到检测结果。那么对于深度模型,常常是端到端的,采用 CNN
进行 深度特征的提取,R-CNN系列则采用 Selective Search
、Region Proposal Network
作为候选样本的进行采集,同时加上了位置的回归,深度模型剩余的部分实际上也是进行的分类。整个解决思路并没有太大的冲突。
所以,传统方法解决方案包括三个步骤,一是选择合适的图像块儿 image patch
特征描述子,二是选择合适的分类器,三是用提取的特征及提供的标签对分类器进行训练。</