cs231n: 第四讲 faster rcnn的解释

本文介绍了计算机视觉中的classification、localization和detection任务,重点解析了Faster R-CNN这一目标检测模型的工作原理。从R-CNN到Fast R-CNN再到Faster R-CNN的演进,强调了Faster R-CNN通过RPN(Region Proposal Network)实现提案生成的端到端训练,显著提升了检测速度和效率。
摘要由CSDN通过智能技术生成

转载请注明:http://blog.csdn.net/c602273091/article/details/54289939

最近在做detection的相关工作,但是对于要做的东西呢总是不太清楚,看了课程介绍之后,终于有了稍微清楚一些的认识。

计算机视觉中一般有以下任务:
这里写图片描述

分类就是给你一张图,你说这是什么,一般来说只有一个目标物体。定位就是确定目标物体的位置,但是你不知道它是什么。所以分类和定位合起来就是给你一张图片,找出一个目标物体的位置,并给出置信度。detection就是多个物体的定位和分类。在detection之后,我们进行图片切割,这就是instance segmentation。

单幅图片的classification和localization

这里写图片描述
classification就是计算目标物体的score,localization是计算一个box,根据IOU计算准确度。

ImageNet就是做的这样的工作,因为每幅图片只有一个目标物体。ImageNet一般取score前五的进行衡量是否正确,IOU>0.5就是正确的。

localization as regression

使用回归来计算box。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值