You Only Look Once: Unified,Real-Time Object Detection

先介绍一下以前的目标检测算法:RCNNFast RCNNFaster RCNN。这三种算法都用到Selective Search方法。之前很多算法都是基于蛮力搜索穷举搜索(Exhaustive Search),对整张图片进行扫描,比如采用滑动窗口法DPM就是采用滑动窗口法,耗时严重。图片包含了各种不同层次的语义,信息非常丰富,包括纹理(Texture),形状(shape),颜色(color)等等。而选择性搜索有两大特点。第一是通过分层分组进行选择性搜索,第二是多样化策略分层分组进行选择性搜索,就是首先使用自下而上的分组(一种流行的分割方法)来创建初始区域。然后计算所有相邻区域之间的相似性。两个最相似的地区被组合在一起,并计算所得到的地区与其邻居之间的新的相似性。重复地把最相似的区域组合在一起,直到整个图像变成单个区域。多样化策略包括通过使用具有不同不变性质的各种颜色空间通过使用不同的相似性度量通过使用不同的初始化区域RCNN通过选择性搜索得到约2k个区域提议,然后将区域提议转换为固定的227*227大小,再从区域提议中提取固定的特征长度的特征向量,再用SVM进行分类,再用非极大值抑制法来精选区域,其中非极大值抑制法就是先保留最大概率值的区域提议框,然后把IOU值很大的区域提议框删除。Fast RCNN也是通过选择性搜索得到约2k个区域提议,将ROI池化成固定大小的特征图的原因是FCs 需要固定大小的输入,网络有两个输出:softmax probabilitiesbounding-box regression。其中,原始图像经过深度卷积(Deep Convnet)得到特征图(feature map),而经过选择性搜索可以得到ROIregions of interest 、区域提议),其中不需要对ROI进行卷积,而RCNN是对每个region proposal分别做卷积,所以很慢。 Faster RCNNRPNFast RCNN组合起来。Faster RCNN可以从特征图中产生区域提议。Faster RCNN用到的交替训练:第一步,使用在ImageNet上预训练的模型初始化RPN,并针对区域提议任务进行了端到端的微调。第二步,使用RPN生成的区域建议训练Fast R-CNN网络,也用ImageNet上预训练的模型初始化Fast R-CNN。第三步使用Fast R-CNN重新初始化RPN,但是要固定卷积层,只微调RPN。第四步,固定Fast R-CNN的卷积层,使用第三步RPN提取的区域提议对Fast R-CNN网络进行微调。这样一来,RPN Fast R-CNN就可以共享相同的卷积层了。其实可以重复这过程,只是没有明显的改善。YOLO速度非常快。由于我们将检测视为回归问题,所以我们不需要复杂的管道,YOLO每秒45帧,而Fast YOLO 每秒150Titan X GPU上没有批处理其次,与基于滑动窗口和区域提议的技术不同,YOLO在训练和测试时,会看到整个图像,即全局的看图像所以它会对上下文信息进行编码。 Fast RCNN因为它看不到更大的上下文,所以背景错误比较多而YOLO的背景错误数量少一半。最后,YOLO泛化能力强。在对自然图像进行训练并对艺术品进行测试时,YOLO大幅优于DPMR-CNNYOLO将输入图像分成S*S个网格。如果某个目标的中心落入网格中,那么该网格负责检测该目标每个网格预测 BB=7)个边界框和这些边界框置信度成绩每个网格还预测C个条件类概率Pr(Classi|Object)YOLO网络有24个卷积层,再接着2个全连接层Fast YOLO使用9卷积层,在这些层中使用少的滤器。除了网络之外,YOLOFast YOLO的所有训练和测试参数都是相同的。这样一来,可以提高速度但是精度下降。每个grid30维,这30维中,8维是回归box的坐标,2维是boxconfidence,还有20维是类别。 重视8维的坐标预测,设置权重 =5对没有objectboxconfidence loss,设置权重 =0.5objectboxconfidence loss和类别的lossloss weight正常取1

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值