透明反射物体分割数据集TROSD: A New RGB-D Dataset for Transparentand Reflective Object Segmentation in Practice

最新推荐文章于 2024-06-05 10:01:20 发布

Benjieming_cui

最新推荐文章于 2024-06-05 10:01:20 发布

阅读量422

点赞数 1

文章标签：计算机视觉人工智能深度学习 Powered by 金山文档

原文链接：https://arxiv.org/abs/2301.05323

版权

作者提出一个数据集组成为：

TROSD is available at http://www.tsinghua-ieit.com/trosd.

SUN-RGBD——具有37个类别的SUN-RGBD数据集，其中包含10 335个RGB-D图像和密集像素注释，从中选取673个用于训练，455个用于测试。SUN RGB-D数据集中有由透明或反射对象组成的图像，但它不为这些对象提供注释。在这种情况下，我们手动标注了这些对象的掩码，共1128个RGB-D图像，并将这些图像的大小调整为640 × 480。

我们从带有注释掩码的ClearGrasp数据集[6]中收集真实测试数据，并通过数据增强生成752张RGB-D图像。对于所有的深度图像，我们将深度值校准为相同的大小和刻度，用线性投影将它们投影到0到255的范围内。

TROSD数据集共包含11060张图片，类型组成为：

网络架构

输入图像为RGB和深度图像，经过水平翻转缩放，size为640x480，分别送入双流resnet50骨干网络。设计了CFM模块，此级联多模态融合模块可以保持和增强透明和反射物体轮廓处的不连续细节。

图中红色CA block，一个通道注意力模块：

BR block：

CMF模块：

其中的AdaLIN模块为Adaptive Layer-Instance Normalization (AdaLIN)，自适应层实例归一化。

损失计算：

在每个上采样阶段应用交叉熵损失。共四个。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
透明反射物体分割数据集TROSD: A New RGB-D Dataset for Transparentand Reflective Object Segmentation in Practice

透明反射物体分割数据集
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。