1、Annotated Hands for Generative Models
中文标题:生成模型的带注释的手
简介:生成模型,如GAN和扩散模型,已经展示了惊人的图像生成能力。然而,这些系统在创建手部图像方面的表现却令人惊讶地不佳。为了提高这些系统在手部图像生成方面的能力,我们提出了一种新的训练框架。我们的方法是使用三个额外的通道来标注图像中的手部,以增强训练图像的结构。这些标注提供了额外的结构信息,促使生成模型生成更高质量的手部图像。我们在两个不同的生成模型上验证了这种方法:生成对抗网络和扩散模型。我们在一个新的合成手部图像数据集以及包含真实手部照片的数据集上展示了我们的方法。我们使用现有的手部检测器,并通过更高的关节识别置信度来衡量生成的手部图像的质量改善。
2、BackdoorBench: A Comprehensive Benchmark and Analysis of Backdoor Learning
中文标题:BackdoorBench:后门学习的综合基准和分析
简介:作为研究深度神经网络漏洞的一个新兴而重要的领域,后门学习近年来吸引了越来越多的关注。许多开创性的后门攻击和防御算法正在快速发展,并处于军备竞赛状态。然而,由于现有工作的多样性设置和实现的困难,缺乏统一和标准化的后门学习基准,导致了不公平的比较和不可靠的结论,可能会产生误导性、偏见或错误的结论。因此,评估当前进展并设计未来发展路线图变得困难。
为了解决这个问题,我们建立了一个全面的后门学习基准,名为BackdoorBench。我们的基准对研究社区做出了三个有价值的贡献。首先,我们提供了最先进的后门学习算法的集成实现,目前包括16种攻击和27种防御算法,基于可扩展的模块化代码库。其次,我们对4个模型和4个数据集进行了全面评估,包括12种攻击对16种防御的评估,涵盖5种污染比率,总共有11,492个评估对。第三,基于这些评估,我们提供了18种有用的分析工具,从8个角度提供了丰富的分析,并提供了一些关于后门学习的启示性见解。
我们希望通过这些努力,建立一个坚实的后门学习基础,帮助研究人员调查现有算法、开发更具创新性的算法,并探索后门学习的内在机制。最后,我们创建了一个用户友好的网站http://backdoorbench.com,收集了BackdoorBench的所有重要信息,包括代码库、文档、排行榜和模型zone。
3、Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data
中文标题:深入一切:释放大规模未标记数据的力量
简介:本研究提出了Depth Anything,一种高度实用的单目深度估计解决方案。我们的目标是构建一个简单而强大的基础模型,能够处理各种图像情况,而不是追求新颖的技术模块。为此,我们设计了一个数据引擎,用于收集和自动注释大规模未标记数据(约6200万),从而扩大了数据覆盖范围,减少了泛化误差。我们研究了两种简单而有效的策略,使数据扩展变得有希望。
首先,我们利用数据增强工具创建了一个更具挑战性的优化目标,迫使模型积极寻求额外的视觉知识并获取强大的表示能力。其次,我们开发了一个辅助监督方法,强制模型从预训练的编码器中继承丰富的语义先验知识。我们广泛评估了该方法在零样本能力上的表现,包括对六个公共数据集和随机捕获的照片的测试。结果展示了令人印象深刻的泛化能力。此外,通过使用来自NYUv2和KITTI的度量深度信息进行微调,我们在深度估计方面取得了新的最佳结果。
我们改进的深度模型还导致了更好的深度条件控制网络。我们已经在https://github.com/LiheYoung/Depth-Anything 上发布了我们的模型。