计算机视觉2——视觉识别任务

最新推荐文章于 2023-08-16 17:16:54 发布

Deserve_p

最新推荐文章于 2023-08-16 17:16:54 发布

阅读量452

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44067447/article/details/115506270

版权

机器学习专栏收录该内容

21 篇文章 0 订阅

订阅专栏

图像分类
语义分割
目标检测
实例分割

语义分割

在这里插入图片描述
C是某个像素得到的信息，就是要得到的像素的语义，再进行交叉熵操作，从而反馈调整网络。

解决内存问题:
在这里插入图片描述

上采样

下采样

重叠部分多了个加权求和。

在这里插入图片描述
这里的滤波器是可以通过学习得到的。

下采样时，转置矩阵，然后相乘，就能实现上采样。

目标检测

单目标
在这里插入图片描述

训练出来包括(多任务): 类别，位置。衡量他们的损失。

多目标
在这里插入图片描述

先产生一些候选区域:Selective search

然后再用边界框回归，修正参数，找到准确的框。
速度问题→改进
Fast R-CNN
在这里插入图片描述
提取全局特征，在特征上再提取区域(极大加快速度，不需要重复计算)。再进行区域裁剪。
区域裁剪Rol Pool

输出的尺寸都一样，就能直接输出为长向量，和神经网络进行全连接。

问题:处理后的区域会有轻微对不齐。→Rol Align
在这里插入图片描述

将卷积后的图，划分为小量级的像素区域，每个区域是一个anchor, 给定一个anchor box, 检测该像素区域是不是目标。→改进: 用box transform框出更加准确的区域。

区域建议网络
在这里插入图片描述

每个像素点都卷积，然后输给FC判断是不是某个分类。

加入anchor, 每个anchor花多个尺寸不同的框(给出多个可能性)，各自给出可能的分类结果(分类分数)。

在这里插入图片描述

实例检测

在这里插入图片描述

在原来Fast RNN基础上增加卷积，和对C进行预测的分类mask

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
计算机视觉2——视觉识别任务

图像分类语义分割目标检测实例分割
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。