TPAMI 2024 综述论文一览 Part2(11篇)(IEEE Transactions on Pattern Analysis and Machine Intelligence)
Does Negative Sampling Matter? a Review With Insights Into its Theory and Applications
文章解读: 负采样重要吗?对其理论和应用进行深入评述
文章链接: (10.1109/TPAMI.2024.3371473)
《Does Negative Sampling Matter? a Review With Insights Into its Theory and Applications》是一篇关于负采样技术的综述文章,探讨了其理论和应用。文章提出了一种通用框架,详细回顾了负采样的历史发展,并将其演变分为五个不同的轨迹。此外,文章还系统地分析了负采样在图表示学习中的作用,从目标和风险的角度出发,理论上证明了负采样在确定优化目标和结果方差方面的重要性。
A Comprehensive Survey of Continual Learning: Theory, Method and Application
文章解读: 持续学习的全面综述:理论、方法与应用
文章链接: (10.1109/TPAMI.2024.3367329)
《A Comprehensive Survey of Continual Learning: Theory, Method and Application》是一篇全面综述持续学习的论文,内容涵盖理论、方法和应用。该综述旨在解决学习新任务时的灾难性遗忘问题,同时保持对旧任务的记忆,并在资源效率下平衡稳定性和可塑性。文章详细分类了持续学习的代表性策略,并分析了各种方法的优缺点和适用场景。此外,综述还总结了持续学习的一般目标,并探讨了其在实际应用中的特殊挑战。
Towards Human-Centered Explainable AI: A Survey of User Studies for Model Explanations
文章解读: 迈向以人为本的可解释人工智能:模型解释的用户研究综述
文章链接: (10.1109/TPAMI.2023.3331846)
《Towards Human-Centered Explainable AI: A Survey of User Studies for Model Explanations》是一篇探讨如何在可解释人工智能(XAI)应用中进行用户研究的论文。该研究基于系统文献综述,分析了过去五年中97篇核心论文,这些论文涉及用户对XAI模型的评估,主要关注信任、理解、可用性和人机协作等特征。这项研究强调了更好地理解XAI用户需求以及进行以人为本的评估的重要性,并指出这是必要且具有挑战性的。
Synthetic Data in Human Analysis: A Survey
文章解读: 人体分析中的合成数据:综述
文章链接: (10.1109/TPAMI.2024.3362821)
《Synthetic Data in Human Analysis: A Survey》是一篇综述文章,介绍了生成和使用合成数据进行人类分析的基本定义和方法。文章总结了当前最先进的方法以及使用合成数据的主要好处,并提供了公开可用的合成数据集和生成模型的概览。此外,它还探讨了深度神经网络在人类分析中的应用,如生物识别、动作识别和人员再识别等。
Differentiable Image Data Augmentation and Its Applications: A Survey
文章解读: 可微图像数据增强及其应用:综述
文章链接: (10.1109/TPAMI.2023.3330862)
《Differentiable Image Data Augmentation and Its Applications: A Survey》是一篇综述文章,主要探讨了可微图像数据增强(DDA)及其在深度学习中的应用。传统的数据增强方法通常作为预处理模块,具有预定义的启发式和受限的可微性。然而,最近的研究表明,通过使用可微分算法进行数据增强策略搜索,可以有效促进神经网络的训练和增强策略搜索。例如,DADA(Differentiable Automatic Data Augmentation)算法显著提高了搜索效率,将搜索代价从5000 GPU小时降低到0.1 GPU小时,同时保持了与传统方法相当的准确率。
Temporal Action Localization in the Deep Learning Era: A Survey
文章解读: 深度学习时代的时间动作定位:综述
文章链接: (10.1109/TPAMI.2023.3330794)
《Temporal Action Localization in the Deep Learning Era: A Survey》是一篇综述文章,发表于2023年11月6日,旨在探讨深度学习时代的时间动作定位(Temporal Action Localization, TAL)研究。该研究的目标是从未修剪的视频中发现动作实例,这是智能视频理解领域的一个基本步骤。随着深度学习的发展,骨干网络在提供代表性时空特征方面发挥了重要作用,而端到端学习范式则推动了高质量模型的开发。
时间动作定位是计算机视觉中一个至关重要的问题,近年来由于其在日常生活中的广泛应用而受到广泛关注。这项任务的主要挑战在于视频通常较长且未修剪,涉及不同的动作内容。深度学习的进展极大地促进了时间动作定位的发展,方法可以分为帧级或段级分类等类别。
此外,弱监督学习(Weakly Supervised Learning)在时间动作定位中也得到了越来越多的关注,因为它允许仅使用视频级标签来检测动作实例,而不需要昂贵且耗时的帧级注释。
Towards Open Vocabulary Learning: A Survey
文章解读: 迈向开放词汇学习:综述
文章链接: (10.1109/TPAMI.2024.3361862)
《Towards Open Vocabulary Learning: A Survey》是一篇全面综述开放词汇学习的论文,发表于2023年6月28日。这篇综述详细总结和分析了开放词汇学习领域的最新发展,比较了与零样本学习、开放集识别和分布外检测等概念的关系。文章还回顾了开放词汇学习的历史,指出了几个代表性方法,并介绍了常用的 datasets 和 metrics。此外,该综述还提供了开放词汇学习在检测和分割任务中的统一符号,并总结了超过50种不同的方法。
A Comprehensive Survey of Dataset Distillation
文章解读: 数据集蒸馏综述
文章链接: (10.1109/TPAMI.2023.3322540)
《A Comprehensive Survey of Dataset Distillation》是一篇全面综述数据集蒸馏技术的文章,发表于2023年10月6日。该综述从多个方面提供了对数据集蒸馏的全面理解,包括蒸馏框架和算法。数据集蒸馏是一种知识蒸馏方法,旨在通过在大型训练数据集中提取关键样本或特征来减少深度神经网络的体积。尽管数据集蒸馏在压缩数据集方面表现出色,但仍存在一些局限性,例如蒸馏高分辨率数据或复杂标签空间的数据。
Automatic Gaze Analysis: A Survey of Deep Learning Based Approaches
文章解读: 自动视线分析:基于深度学习的方法综述
文章链接: (10.1109/TPAMI.2023.3321337)
《Automatic Gaze Analysis: A Survey of Deep Learning Based Approaches》是一篇关于自动眼球追踪技术的研究综述,主要探讨了基于深度学习的方法在计算机视觉和人机交互领域的应用。尽管在过去十年中取得了显著进展,但自动眼球分析仍面临挑战,这主要是由于眼睛外观的独特性和眼-头互动的复杂性。
Blockchain Data Mining With Graph Learning: A Survey
文章解读: 结合图学习的区块链数据挖掘:综述
文章链接: (10.1109/TPAMI.2023.3327404)
《Blockchain Data Mining With Graph Learning: A Survey》是一篇关于使用图学习进行区块链数据挖掘的调查文章。该文章探讨了区块链数据挖掘的潜力,指出其能够揭示匿名参与者的行为模式和系统运行状态,但传统的分析方法由于数据量大、结构复杂而存在处理困难的问题。文章还提到,通过将链上交易行为建模成大型的区块链交易图,并运用图学习技术,可以分析区块链中的潜在安全性问题。此外,图神经网络(GNN)被认为是适合于区块链数据分析的技术,因为区块链数据本质上可以表示为一个图,其中节点表示地址,边表示交易等行为。
Face Generation and Editing With StyleGAN: A Survey
文章解读: 使用StyleGAN进行人脸生成与编辑:综述
文章链接: (10.1109/TPAMI.2024.3350004)
《Face Generation and Editing With StyleGAN: A Survey》是一篇综述文章,旨在提供使用StyleGAN进行人脸生成和编辑的最新深度学习方法的概览。该综述涵盖了从PGGAN到StyleGAN3的发展历程,并探讨了相关主题,如适合训练的度量标准、不同的潜在表示、GAN到StyleGAN潜在空间的反向映射、人脸图像编辑、跨域人脸风格化、人脸修复以及Deepfake应用。