【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

最新推荐文章于 2024-07-07 00:21:56 发布

数据派THU

最新推荐文章于 2024-07-07 00:21:56 发布

阅读量150

点赞数

文章标签：算法机器学习深度学习人工智能神经网络

原文链接：https://mp.weixin.qq.com/s?__biz=MzI1MjQ2OTQ3Ng==&mid=2247567849&idx=3&sn=9052e940349a3aeb2d9e4e3464fb50ad&chksm=e9e0c062de97497410099936af188001db1b4c77f09db0ad8725fe9c1f5d6a564dcdc719ca19&scene=126&&sessionid=0

版权

本文介绍了一种新算法，用于在训练多模态深度神经网络时平衡不同模态的条件学习速度，旨在解决贪婪学习导致的模型依赖单一模态的问题。通过计算条件利用率，作者发现模态间的利用率存在不平衡，进而提出了基于条件学习速度的代理方法。实验证明，该算法能有效提高模型在ColoredMNIST、ModelNet40和NVIDIA DynamicHandGesture数据集上的泛化性能。

摘要由CSDN通过智能技术生成

来源：专知
本文为论文，建议阅读5分钟我们提出了一种算法来平衡训练过程中模态之间的条件学习速度，并证明它确实解决了贪婪学习的问题该算法提高了模型在三个数据集上的泛化能力。

我们假设，由于多模态深度神经网络学习的贪婪性质，这些模型往往只依赖于一种模态，而不拟合其他模态。根据我们的经验观察，这种行为是反直觉的，并且损害了模型的泛化。为了估计模型对每种模态的依赖性，我们计算当模型除了另一种模态外还可以访问它时，对精度的增益。我们把这个增益称为条件利用率。在实验中，我们始终观察到不同模态之间的条件利用率不平衡，跨多个任务和架构。由于在训练过程中不能有效地计算条件利用率，我们引入了一个基于模型从每个模态学习的速度的代理，我们称之为条件学习速度。我们提出了一种算法来平衡训练过程中模态之间的条件学习速度，并证明它确实解决了贪婪学习的问题该算法提高了模型在三个数据集上的泛化能力:Colored MNIST、ModelNet40和NVIDIA Dynamic Hand Gesture。

https://www.zhuanzhi.ai/paper/a175b09bb7bfe5bc36d68b6fdf98fe86

数据派THU

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

来源：专知本文为论文，建议阅读5分钟我们提出了一种算法来平衡训练过程中模态之间的条件学习速度，并证明它确实解决了贪婪学习的问题该算法提高了模型在三个数据集上的泛化能力。我们假设，由于多模态深度神经网络学习的贪婪性质，这些模型往往只依赖于一种模态，而不拟合其他模态。根据我们的经验观察，这种行为是反直觉的，并且损害了模型的泛化。为了估计模型对每种模态的依赖性，我们计算当模型...
复制链接

扫一扫