计算机视觉最新进展概览2021年10月31日到2021年11月6日

参考计算机视觉最新进展概览2021年10月31日到2021年11月6日 - 云+社区 - 腾讯云

1、Learning Distilled Collaboration Graph for Multi-Agent Perception

为了促进多智能体感知中更好的性能带宽权衡,我们提出了一种新的蒸馏协作图(DiscoGraph),用于建模智能体之间的可训练、姿态感知和自适应协作。 我们的创新主要体现在两个方面。 首先,我们提出了一个通过知识蒸馏训练DiscoGraph的师生框架。 教师模式采用了早期协作的整体观点输入; 学生模型是基于具有单视图输入的中间协作。 我们的框架通过约束学生模型中的协作后特征映射来匹配教师模型中的对应关系来训练DiscoGraph。 其次,我们在DiscoGraph中提出了一个矩阵值边权。 在这样的矩阵中,每个元素都反映了特定空间区域的主体间注意力,允许主体自适应地突出信息区域。 在推理过程中,我们只需要使用名为蒸馏协作网络(DiscoNet)的学生模型。 由于教师-学生框架,多个具有共享DiscoNet的agent可以以整体的观点协作地接近一个假设的教师模型的性能。 我们利用CARLA和SUMO联合仿真合成了一个大型多智能体感知数据集V2X-Sim 1.0,并对该方法进行了验证。 我们在多智能体三维物体检测中的定量和定性实验表明,DiscoNet不仅可以实现比最先进的协同感知方法更好的性能和带宽权衡,而且带来了更直观的设计原理。

2、OctField: Hierarchical Implicit Functions for 3D Modeling

局部隐函数的研究使神经内隐表示可以扩展到大场景。 然而,这些方法所采用的规则的三维空间细分没有考虑到表面占用的稀疏性和几何细节的粒度变化。 因此,它的内存占用随着输入体积的增大而呈立方增长,即使在中等密度的分解中,也会导致令人望而却步的计算成本。 在这项工作中,我们提出了一个可学习的三维曲面层次隐式表示,编码OctField,允许高精度编码复杂曲面,使用低内存和计算预算。 我们方法的关键是3D场景的自适应分解,只在感兴趣的表面上分布局部隐函数。 我们通过引入层次化的八叉树结构,根据曲面占用率和零件几何的丰富性自适应地细分三维空间来实现这一目标。 由于八叉树的离散性和不可微性,我们进一步提出了一种新的层次网络,该网络将八叉树细胞的细分建模为一个概率过程,并以可微的方式递归编码和解码八叉树结构和曲面几何。 我们演示了OctField在一系列形状建模和重建任务中的价值,显示了它比其他方法的优越性。  

3、Bootstrap Your Object Detector via Mixed Training

我们引入了混合训练,一种新的目标检测训练范式,可以免费提高现有检测器的性能。 MixTraining通过利用不同强度的增强来增强数据增强,同时排除某些可能不利于训练的训练样本的强增强。 此外,它通过合并可以弥补这些错误的伪框来解决人工注释中的本地化噪声和缺失标签。 这两种混合训练能力都是通过检测器上的自举实现的,这可以用来预测在强增强上训练的难度,以及由于神经网络对标记错误的鲁棒性而生成可靠的伪框。 MixTraining被发现在COCO数据集上的各种检测器上带来了一致的改进。 特别是,使用ResNet-50 \cite{he2016deep}骨干的Faster R-CNN \cite{ren2015faster}的性能从41.7 mAP提高到44.0 mAP,使用swwin - small \cite{liu2021swin}骨干的Cascade-RCNN \cite{cai2018cascade}的准确性从50.9 mAP提高到52.8 mAP。  

4、Combating Noise: Semi-supervised Learning by Region Uncertainty Quantification

半监督学习旨在利用大量未标记的数据来提高性能。 现有的工作主要集中在图像分类。 在本文中,我们深入研究了用于目标检测的半监督学习,其中标记数据的收集更加劳动密集型。 目前的方法容易受到伪标签产生的噪声区域的干扰。 为了对抗噪声标记,我们提出了通过量化区域不确定性来抗噪声的半监督学习方法。 我们首先研究不同形式的伪标签噪声带来的不良影响。 然后我们提出通过识别不同强度区域的抗噪声特性来量化区域的不确定性。 通过引入区域不确定性量化和促进多峰概率分布输出,将不确定性引入到训练中,进一步实现抗噪声学习。 在PASCAL VOC和MS COCO上的实验证明了该方法的卓越性能。  

5、Distilling Object Detectors with Feature Richness

近年来,大规模深度模型取得了巨大的成功,但其庞大的计算复杂度和存储需求使其在资源有限的设备上部署成为巨大的挑战。 知识提取作为一种模型压缩和加速的方法,通过转移教师检测器的暗知识,有效地提高了小模型的性能。 然而,现有的基于蒸馏的检测方法大多是模仿边界盒附近的特征,存在两个局限性。 首先,它们忽略了边界框之外的有益功能。 其次,这些方法模拟了一些被教师检测器错误地视为背景的特征。 为了解决上述问题,我们提出了一种新的特征丰富度评分(FRS)方法来选择重要的特征,提高了蒸馏过程中的广义检测能力。 该方法能有效地检索边界框外的重要特征,并去除边界框内的有害特征。 大量的实验表明,我们的方法在基于锚和无锚的检测器上都取得了良好的性能。 例如,使用ResNet-50的retanet在COCO2017数据集上的mAP达到39.7%,甚至比基于ResNet-101的教师检测器(38.9%)高出0.8%。  

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Wanderer001

ROIAlign原理

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值