object detection

最新推荐文章于 2019-08-16 18:22:00 发布

yanzi-000

最新推荐文章于 2019-08-16 18:22:00 发布

阅读量165

点赞数

分类专栏： CV

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuchuyan/article/details/94653315

版权

CV 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

1.yolo

2.RCNN

步骤:

1.采用selective search生成候选区域（region proposal）

2.将候选区域输入到一个预训练的网络（fine-tuning）

3.每个类别训练一个SVM分类器，用regressor对候选框进行回归

缺点:

时间和内存消耗太大，训练SVM和回归的时候都需要用网络生成的特征作为输入

3.Fast R-CNN

4.Faster R-CNN

faster r-cnn示意图
https://github.com/yhenon/keras-frcnn(deprecated)

https://github.com/softberries/keras-frcnn

https://github.com/small-yellow-duck/keras-frcnn

https://github.com/fizyr/keras-retinanet

vgg中，con3_64，表示卷积核为(3, 3),filters数目为64
vgg
SPP-net： spatial pyramid pooling ,空间金字塔池化层，放置在卷积层和全连接层之间，对特征图像进行压缩处理，避免了在进入卷积层之前要对图像进行截取（crop warp），卷积层对图像的尺寸没有限制，但全连接层对尺寸有限制。

bag of words: 词袋模型，常用于语言识别，句子是由多个关键词构成，通过关键词可以对句子进行表示。应用在图像识别中，整体图像可以由局部的图像组成。局部的图像组合在一起即为词袋，可以用于表示整体图像。

loss function

对两类anchors会打上正标签：（1）与实际（ground-truth）box的IoU（Intersection-over-Union）值最大，（2）与实际box的IoU值超过0.7
以第二个条件为依据可以满足大多数情况

如果IoU值低于0.3则为负标签

如果某个anchors即非正也非负，则不会作为训练对象

anchors

对于1000 x 600的图片，大概有20000（≈ 60 x 40 x 9）个anchors，9是3种纵横比，3种分辨率之积，60是1000/16，40是600/16，经过vgg后，图片会从（A，B，3）变为（A/16，B/16，512），详情见VGG-16

忽略掉跨过边界的anchors，每张图片还剩余6000个anchors，进过NMS（非最大抑制，阈值为0.7），剩余2000张候选区域（proposal regions）

5.Mask R-CNN

https://github.com/matterport/Mask_RCNN

案例
点击
 点击

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
object detection

1.yolo2.RCNN步骤:1.采用selective search生成候选区域（region proposal）2.将候选区域输入到一个预训练的网络（fine-tuning）3.每个类别训练一个SVM分类器，用regressor对候选框进行回归缺点:时间和内存消耗太大，训练SVM和回归的时候都需要用网络生成的特征作为输入3.Fast R-CNN4.Faster R-CNN[...
复制链接

扫一扫

专栏目录

yanzi-000 CSDN认证博客专家 CSDN认证企业博客

码龄17年

35: 原创

27万+: 周排名

151万+: 总排名

2万+: 访问

: 等级

635: 积分

3: 粉丝

2: 获赞

5: 评论

17: 收藏

私信

关注

热门文章

分类专栏

学习笔记 3篇
代码片
big data 3篇
computer 12篇
ML 4篇
CV 13篇

最新评论

face recognition
yanzi-000: 不好意思，近来没怎么关注人脸识别方面的内容。如果是实际应用的话，模型之前的图像预处理做了足够的优化吗
face recognition
阿铖f: 请问博主Google的facenet的准确率已经在99.6左右了，在现在效果还是很前端的么？还有没有比facenet效果更好的人脸识别模型
face recognition
努力爬坡的小白: 谢谢你的建议
face recognition
yanzi-000 回复努力爬坡的小白: 没有做过这一块的内容,但是可以考虑一下使用深度相机,生成点云后识别出鼻子,鼻子的深度减去鼻子旁边的皮肤的深度就是鼻子的高度了.
face recognition
努力爬坡的小白: 你好，请问对于测量鼻子高度，是先将鼻子识别出来再进行测量吗，请问您有计算鼻子高度的代码吗？急用，万分感谢。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。