坐标定位手机元素_图像分割、分类和定位

1、语义分割

概念:对图像中的每个像素做分类,实现像素级别的分类

实例分割与之不同:在相同像素级别上对不同实例进行区分

比如:一张图片中有两头牛,语义分割是将两头牛归为一类,而实例分割会将两头牛进行区分

方法:

(1)滑动窗口:把图片分成小块,使用网络对中心点进行分类

缺点:计算量大,效率低

(2)全卷积网络(FCN):将完整图像输入卷积神经网络,计算出预测像素和label(真实像素)的交叉熵损失,利用反向传播训练网络。

缺点:数据标签制作成本很高,在原图上进行卷积计算量很大

(3)基于方法(2),进行上采样和下采样

下采样的方法又可以分为两种:

1)unpooling

Nearest Neighbor

cb6ee33658a5ee9bc7166e09e607d065.png
重复元素

Bed of Nails

af32e4b40cef1af5ef8d390829f5e2d1.png
左上角为元素值,其余补零

Max Unpooling

173fa00ffea22ec7b3de6e689a888e80.png
与Bed of Nails类似,只不过原来元素位置放置不同,是按照之前下采样时最大池化的元素位置

2)转置卷积(Transpose convolution)

61b03d22cbea7e02e5e0840d40b58fd9.png

2、分类和定位

图片中只有一个物体

496613f7eee2c0493f3c13310e4d17b9.png

损失函数包括两部分:

softmax损失,计算分类损失;L2损失,计算预测坐标和实际坐标的损失。

3、目标检测

与分类+定位的不同就是目标检测需要分类和定位的数目不确定

经典方法:

RCNN、Fast R-CNN、Faster R-CNN、YOLO/SSD、mask R-CNN

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值