透明反射物体分割数据集TROSD: A New RGB-D Dataset for Transparentand Reflective Object Segmentation in Practice

作者提出一个数据集组成为:

TROSD is available at http://www.tsinghua-ieit.com/trosd.

SUN-RGBD——具有37个类别的SUN-RGBD数据集,其中包含10 335个RGB-D图像和密集像素注释,从中选取673个用于训练,455个用于测试。SUN RGB-D数据集中有由透明或反射对象组成的图像,但它不为这些对象提供注释。在这种情况下,我们手动标注了这些对象的掩码,共1128个RGB-D图像,并将这些图像的大小调整为640 × 480。

我们从带有注释掩码的ClearGrasp数据集[6]中收集真实测试数据,并通过数据增强生成752张RGB-D图像。对于所有的深度图像,我们将深度值校准为相同的大小和刻度,用线性投影将它们投影到0到255的范围内。

TROSD数据集共包含11060张图片,类型组成为:

网络架构

输入图像为RGB和深度图像,经过水平翻转缩放,size为640x480,分别送入双流resnet50骨干网络。设计了CFM模块,此级联多模态融合模块可以保持和增强透明和反射物体轮廓处的不连续细节。

  1. 图中红色CA block,一个通道注意力模块:

  1. BR block:

  1. CMF模块:

其中的AdaLIN模块为Adaptive Layer-Instance Normalization (AdaLIN),自适应层实例归一化。

损失计算:

在每个上采样阶段应用交叉熵损失。共四个。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值