每日学术速递3.2

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理  

Subjects: cs.CV

1.Interactive Segmentation as Gaussian Process Classification(CVPR 2023)

标题:作为高斯过程分类的交互式分割

作者:Minghao Zhou, Hong Wang, Qian Zhao, Yuexiang Li, Yawen Huang, Deyu Meng, Yefeng Zheng

文章链接:https://arxiv.org/abs/2302.14578v1

项目代码:https://github.com/zmhhmz/gpcis_cvpr2023

摘要:

        基于点击的交互式分割(IS)旨在提取用户交互下的目标对象。对于这项任务,当前大多数基于深度学习 (DL) 的方法主要遵循语义分割的一般流程。尽管取得了令人鼓舞的性能,但它们并没有完全明确地利用和传播点击信息,不可避免地导致不令人满意的分割结果,即使在点击点也是如此。针对这个问题,在本文中,我们建议将 IS 任务制定为每个图像上基于高斯过程 (GP) 的逐像素二进制分类模型。为了解决这个模型,我们利用分摊变分推理以数据驱动的方式逼近难处理的 GP 后验,然后将近似的 GP 后验解耦为双空间形式,以实现具有线性复杂度的高效采样。然后,我们相应地构建了一个 GP 分类框架,命名为 GPCIS,它与深度内核学习机制相结合,具有更大的灵活性。所提出的 GPCIS 的主要特点在于:1)在派生 GP 后验的明确指导下,点击中包含的信息可以很好地传播到整个图像,然后促进分割;2)点击预测的准确性有很好的理论支持。GPCIS 的这些优点及其良好的通用性和高效率已通过几个基准的综合实验得到证实,并与代表性方法进行了定量和定性比较。

2.ProxyFormer: Proxy Alignment Assisted Point Cloud Completion with Missing Part Sensitive Transformer(CVPR 2023)

标题:ProxyFormer:代理对齐辅助点云完成与缺失部分敏感变压器

作者:Shanshan Li, Pan Gao, Xiaoyang Tan, Mingqiang Wei

文章链接:https://arxiv.org/abs/2302.14435v1

项目代码:https://github.com/i2-multimedia-lab/proxyformer

摘要:

        设备缺陷或视点受限等问题会导致捕获的点云不完整。因此,从部分点云中恢复完整点云在许多实际任务中起着至关重要的作用,而关键之一在于对缺失部分的预测。在本文中,我们提出了一种新颖的点云完成方法,即 ProxyFormer,它将点云分为现有(输入)和缺失(待预测)部分,每个部分通过其代理传递信息。具体来说,我们通过特征和位置提取器将信息融合到点代理中,并从现有点代理的特征中生成缺失点代理的特征。然后,为了更好地感知缺失点的位置,我们设计了一个缺失部分敏感转换器,将随机正态分布转换为合理的位置信息,并使用代理对齐来细化缺失代理。它使预测点代理对缺失部分的特征和位置更加敏感,从而使这些代理更适合后续的由粗到精的过程。实验结果表明,我们的方法在几个基准数据集上优于最先进的补全网络,并且具有最快的推理速度。代码可在 https://github.com/I2-Multimedia-Lab/ProxyFormer 获得。

Subjects: cs.LG

3.RoPAWS: Robust Semi-supervised Representation Learning from Uncurated Data(ICLR 2023)

标题:RoPAWS:从未经整理的数据中进行稳健的半监督表示学习

作者:Sangwoo Mo, Jong-Chyi Su, Chih-Yao Ma, Mido Assran, Ishan Misra, Licheng Yu, Sean Bell 

文章链接:https://arxiv.org/abs/2302.14483v1

项目代码:https://github.com/facebookresearch/suncet

摘要:

        半监督学习旨在使用有限的标签训练模型。用于图像分类的最先进的半监督方法(例如 PAWS)依赖于使用大规模未标记但经过整理的数据学习的自我监督表示。但是,当使用未经整理的真实世界未标记数据(例如,包含类外数据)时,PAWS 通常效率较低。我们提出了 RoPAWS,它是 PAWS 的强大扩展,可以处理真实世界的未标记数据。我们首先将 PAWS 重新解释为使用核密度估计对密度进行建模的生成分类器。从这个概率的角度来看,我们根据标记和未标记数据的密度校准其预测,从而根据贝叶斯规则得出一个简单的封闭形式的解决方案。我们证明,RoPAWS 显着提高了未策划的 Semi-iNat 的 PAWS + 5.3% 和策划的 ImageNet + 0.4%。

更多Ai资讯:公主号AiCharm
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AiCharm

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值