图像识别技术与应用-图像分割

图像分割:预测目标的轮廓。将不同的像素划分到不同的类别,非常细粒度的分类。

图像分割的应用场景

人像抠图,医学组织提取,遥感图像分析,自动驾驶,材料图像等

图像分割的前景与背景

  • 物体Things:可数前景目标(行人等)。
  • 事物Stuff:不可数背景(天空,草地,路面)

图像分割的三层境界包括语义分割、实例分割、全景分割。

  • 语义分割(semantic segmentation):每一个像素必须只能属于一类,预测结果为掩膜
  • 实例分割(instance segmentation):只预测前景目标的类别属性以及边框,个体ID,每一个像素可以属于多个ID。
  • 全景分割(panoptic segmentation):每个像素点分配一个语义类别和一个唯一的实例ID。

图像分割的数据集

VOC数据集:PASCAL VOC挑战赛(The PASCAL Visual Object Classes)是一个世界级的计算机视觉挑战赛,从2007年开始引进了语义分割和实例分割的标注。一共2913张图,1464张训练图片,1449张验证图片。

Cityscape数据集

  • 50个城市在春夏秋三个季节不同时间段不同场景、背景的街景图。
  • 30个类别。5000张精细标注的图像(2975张训练图、500张验证图和1525张测试图)、20000张粗略标注的图像。

语义分割和实例分割

COCO数据集:以场景理解为目标,特别选取比较复杂的日常场景。共91类,以人类4岁小孩能够辨识为基准,其中82类有超过5000个instance。

语义分割的评估指标

  • Pixel Accuracy:逐像素分类精度。
  • Mean Pixel Accuracy:每个类内被正确分类像素数的比例
  • IoU:前景目标交并比。
  • mIoU:每个类的IoU平均值。
  • FWIoU:根据每个类出现的概率给mIoU计算权重。

图像分割网络的两个模块

  • 卷积模块:提取特征。
  • 反卷积模块:上采样恢复到原图尺度

卷积

  • 输入4*4, 
  • 输出2*2, 
  • 卷积核3*3,  

 

反卷积

  • 输入2*2,  
  • 输出4*4, 
  • 卷积核3*3, 

 卷积与反卷积(转置关系,transposed)

 

 典型图像分割网络

 卷积网络:编码器

 反卷积网络:解码器

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值