《论文阅读》xMUDA: Cross-Modal Unsupervised Domain Adaptation for 3D Semantic Segmentation

留个笔记自用

xMUDA: Cross-Modal Unsupervised Domain Adaptation for 3D Semantic Segmentation

做什么

Instance segmentation实例分割
在这里插入图片描述
目标检测( Object detection)不仅需要提供图像中物体的类别,还需要提供物体的位置(bounding box)。语义分割( Semantic segmentation)需要预测出输入图像的每一个像素点属于哪一类的标签。实例分割( instance segmentation)在语义分割的基础上,还需要区分出同一类不同的个体。
在这里插入图片描述
这里就是从2D图像的分割转移到了点云上的分割,无非就是在位置信息上多了一维

做了什么

在这里插入图片描述
跨模态算法,2D图像和3D点云共同作用于3D语义分割,这里是分离了2D和3D的私有信息和共享信息,然后进行相互学习。
上图展示的是对比的结果,单单只有2D图片的分割效果和只有3D点云分割效果均有问题,而二者结合进行的分割效果较好。
在此之上,还使用了无监督的方法来进行算法模型的训练。

怎么做

在这里插入图片描述
首先还是定义一下输入和输出,源数据集S,每个样本包含一个2D图片x2d∈R(H,W,3)和一个3D点云x3d∈RN×3和对应的3D分割标签y3d,还有一个目标数据集T,包含的样本内容和上面相同,但没有标签y。
然后就是具体的结构实现
首先2D图片和3D点云都需要经过一个feature extractor来提取特征,2D采用的是Resnet,3D采用的是Unet,二者都结合上了稀疏卷积
稀疏卷积
分别得到两个feature map
在这里插入图片描述
在这里插入图片描述
然后在两个feature map后加一个全连接层,再接上一个softmax得到各自点的分割结果(也就是分类结果)
在这里插入图片描述
这里稍微有点区别的就是2D图片如果要获得3D的feature map的分类结果,还需要结合点云映射下的2D图,然后再sample至N个点的特征情况
在这里插入图片描述
同时这里为了建议2D和3D的联系,设计了一个模仿损失,比如利用2D得到的feature map去模拟3D点云的分割结果,也就是使用当前模态去模拟另一个模态的输出,一个跨模态优化目标将两个模态的输出对齐。
在这里插入图片描述
这里设计的方法也就是构造了四个分割头,两个各自输出各自模态下的分割结果,另外两个模拟另外一个模态下的分割结果
然后是网络训练的LOSS
首先是3D分割的结果LOSS,Lseg,这个LOSS是在源数据上计算的
在这里插入图片描述
这里是采用的cross-entropy的形式,x可以是2D图片也可以是3D点云,P就是预测的逐点结果,y是点分割的GT
然后是跨模态学习的LOSS,这里是无监督学习的一个双重LOSS,一个LOSS是希望做到前面的2D和3D的转模态适应,Lxm
在这里插入图片描述
这里的(P,Q)∈
其中P是主要预测的目标分布,将通过模拟预测Q进行估计,简单来说,这里就是双重匹配,P2D是2D的branch预测的概率,P2D->3D是用2D图像跨模态预测3D的branch的概率,另外两个同理,这里要做的就是使任意两者尽可能相似,做到无监督跨模态的效果
在这里插入图片描述
然后
在这里插入图片描述
这里的意思是在源数据集上使用需要GT的Lseg来进行训练,跨模态损失Lxm作为一种辅助,而在没有GT的目标数据集上使用Lxm直接进行拟态训练
在此之外,这里还设计了一种附加的方法
在使用上式在源数据集和目标数据集上训练过后,使用训练完的模型在目标数据集上进行预测,预测出来的结果作为Pseudo-Labels伪标签,然后将其作为GT进行训练
在这里插入图片描述在这里插入图片描述

总结

1.一种常见的监督后无监督后自监督的方法,框架的构造方式值得学习,挺有意思的,感觉所有跨模态的做法都可以这么做成互相预测异模态的方式

  • 7
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 9
    评论
### 回答1: close-on-click-modal是一个Vue.js组件的属性,用于指定当用户点击模态框(弹出框)外部时,是否自动关闭模态框。如果设置为true,则点击模态框外部会自动关闭模态框;如果设置为false,则点击模态框外部不会关闭模态框。 ### 回答2: close-on-click-modal是一个前端开发中常用的功能,它可以用来实现当模态框弹出时,点击模态框以外的区域可以关闭模态框。这样做可以提高用户体验,使用户在使用网页时感觉更加流畅和方便。 在实现这一功能时,可以采用不同的方案。一种方案是利用JavaScript实现,具体来说就是在模态框弹出时给其添加一个蒙版层,通过监听蒙版层的点击事件来触发模态框的关闭操作。这种方案的实现比较简单,但需要注意的是,遮罩层的z-index值需要设置得较高,以确保它在模态框之上。另外,还需要注意防止遮罩层和模态框之间的事件冒泡。 另一种方案是使用CSS解决,这种方案的实现难度比较低,只需要在模态框外添加一个空的div元素,然后对其进行一定的样式设置,即可实现点击空白区域关闭模态框的效果。具体而言,可以设置该div元素的z-index为比模态框小,然后通过设置其宽度和高度为100%,以覆盖整个页面,实现点击空白区域关闭模态框的需求。 无论采用哪种方案,具体的实现过程都需要根据项目具体情况进行调整。需要注意的是,为了保证用户使用体验,关闭模态框时最好加入一些动效,使其看起来更加流畅和自然。 ### 回答3: 在网站上,模态框是一个非常有用的工具,可以让用户通过中断对当前页面的操作来完成某些任务,如登录、填写表单或进行某些操作等。通常情况下,当用户点击模态框外的区域,或者模态框中的某个“关闭”按钮时,模态框会关闭。 在某些情况下,网站开发人员可能希望在用户点击某些特定区域时跳过模态框,或者直接关闭它。这就是“close-on-click-modal”的意思。简而言之,它会使模态框在点击按钮或其他空白区域时自动关闭。 通过在网站上实现关闭点击模态框,可以大大提高用户的交互体验和用户友好性。例如,在填写表单时,用户可能会在不小心点击其他区域时误触模态框。如果模态框没有“close-on-click-modal”的功能,用户需要找到关闭按钮或通过其他方式关闭模态框。这可能会使用户感到非常烦恼和沮丧。 同时,实现“close-on-click-modal”也可能会增加一些附加功能,例如在鼠标悬停在模态框上时突出显示关闭按钮,或者在特定的动作触发时关闭模态框。开发人员可以根据需要进行自定义,并根据实际使用情况来确定最佳实践。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值