CS231n Lecture11

最新推荐文章于 2023-07-19 13:26:12 发布

夜夜0810

最新推荐文章于 2023-07-19 13:26:12 发布

阅读量455

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33669204/article/details/84960607

版权

本文探讨了计算机视觉中的四个关键任务：语义分割、分类加定位、对象检测和实例分割。详细解释了如何使用unpooling和转置卷积解决尺寸问题，特别是Max unpooling和transpose convolution的原理。此外，提到了分类损失和回归损失的差异，并简单介绍了RCNN系列在对象检测中的应用，最后提到了Mask R-CNN在实例分割领域的进展。

摘要由CSDN通过智能技术生成

Detection and Segmentation

Semantic Segmentation
Classification + Location
Object Detection
Instance Segmentation

首先要区分计算机视觉中几个任务的概念。
在这里插入图片描述
Semantic Segmentation：根据图片中各个像素的语义进行像素的切分。
classification+Localization：将图片中的单一目标检测出来，并且用矩形框将其框出。
Object Detection：将图片中的不同目标用矩形框框出，与classification+location的区别在于识别物体的多少。
Instance Segmentation：将图片中的目标与背景分割开，与semantic segmentation类似。

Semantic Segmentation

一种方法是用sliding window，这种方法是将图片中每一个window范围内的像素进行分类，显然这种方法的计算量很大。
可以用卷积神经网络来求，但是由于最终输出的尺寸与输入图片的尺寸相同，如果在过程中不对图片的尺寸进行缩减，那么直接是用卷积神经网络的计算量会特别大。
针对该问题采用的方法是先降低尺寸，再通过一定的方法增大尺寸，网络结构如图：
在这里插入图片描述
这里用到了两种方法：1. unpooling; 2.transpose convolution

unpooli

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

夜夜0810 CSDN认证博客专家 CSDN认证企业博客

码龄9年

36: 原创

18万+: 周排名

186万+: 总排名

2万+: 访问

: 等级

578: 积分

20: 粉丝

7: 获赞

10: 评论

37: 收藏

私信

关注

热门文章

分类专栏

最新评论

mask_benchmark训练自己的数据集
qq_41802530: 好的谢谢博主在转换的时候出现了这个问题您可以帮忙看一下吗 Traceback (most recent call last): File "jso.py", line 152, in <module> labelme2coco(labelme_json,'.\new.json') File "jso.py", line 32, in __init__ self.save_json() File "jso.py", line 144, in save_json self.data_transfer() File "jso.py", line 37, in data_transfer data = json.load(fp) # 加载json文件 File "D:\Anaconda3\envs\tensorflow_gpu\lib\json\__init__.py", line 268, in load parse_constant=parse_constant, object_pairs_hook=object_pairs_hook, **kw) File "D:\Anaconda3\envs\tensorflow_gpu\lib\json\__init__.py", line 319, in loads return _default_decoder.decode(s) File "D:\Anaconda3\envs\tensorflow_gpu\lib\json\decoder.py", line 339, in decode obj, end = self.raw_decode(s, idx=_w(s, 0).end()) File "D:\Anaconda3\envs\tensorflow_gpu\lib\json\decoder.py", line 357, in raw_decode raise JSONDecodeError("Expecting value", s, err.value) from Nonejson.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)
mask_benchmark训练自己的数据集
夜夜0810 回复 qq_41802530: maskrcnn-benchmark根据readme配置之后，可以使用coco格式的数据集进行训练（也可以使用VOC格式，我没有测试应该如何修改），而labelme标注之后生成的json文件格式与coco指定的格式不同，因此不能直接用json文件来训练
mask_benchmark训练自己的数据集
qq_41802530: 您好我第一次做相关的工作请教您的问题比较基础。您可以帮我解释一下labelme 标完生成.json 后为什么不能直接用来训练吗？
mask_benchmark训练自己的数据集
夜夜0810 回复士羽gzy: 这个yaml文件自己根据configs文件夹中的yaml文件写的，可以根据自己的需要对参数进行更改
mask_benchmark训练自己的数据集
士羽gzy: 不好意思，还有一个问题，希望您不吝赐教。config_file = "configs/test_weights.yaml"中的yawl文件是哪里得到的呢？我只生成了.pth文件

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。