cs231n: 第四讲 faster rcnn的解释

最新推荐文章于 2024-07-12 11:25:47 发布

Snail_Walker

最新推荐文章于 2024-07-12 11:25:47 发布

阅读量2.8k

点赞数

分类专栏： CMU: Computer Vision Computer Vision 文章标签： faster rcnn cnn cs231n

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c602273091/article/details/54289939

版权

本文介绍了计算机视觉中的classification、localization和detection任务，重点解析了Faster R-CNN这一目标检测模型的工作原理。从R-CNN到Fast R-CNN再到Faster R-CNN的演进，强调了Faster R-CNN通过RPN（Region Proposal Network）实现提案生成的端到端训练，显著提升了检测速度和效率。

摘要由CSDN通过智能技术生成

转载请注明：http://blog.csdn.net/c602273091/article/details/54289939

最近在做detection的相关工作，但是对于要做的东西呢总是不太清楚，看了课程介绍之后，终于有了稍微清楚一些的认识。

计算机视觉中一般有以下任务：
这里写图片描述

分类就是给你一张图，你说这是什么，一般来说只有一个目标物体。定位就是确定目标物体的位置，但是你不知道它是什么。所以分类和定位合起来就是给你一张图片，找出一个目标物体的位置，并给出置信度。detection就是多个物体的定位和分类。在detection之后，我们进行图片切割，这就是instance segmentation。

单幅图片的classification和localization

这里写图片描述
classification就是计算目标物体的score，localization是计算一个box，根据IOU计算准确度。

ImageNet就是做的这样的工作，因为每幅图片只有一个目标物体。ImageNet一般取score前五的进行衡量是否正确，IOU>0.5就是正确的。

localization as regression

使用回归来计算box。

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。