Hierarchical Prompt Learning for Multi-Task Learning

Motivation

提示工程,即手动设计提示,是获得有意义的提示以适应 VLM 的直接方法。然而,它不可避免地引入了人为偏见,并需要耗费大量时间找到合适的提示。在多任务学习的背景下,并非所有任务之间的知识都相互受益,将其与 Prompt 结合起来的时候,对所有 Task 都用相同的提示或者为每个 Task 设置自己的提示效果都不如对其进行结合的结果。
本文探究了如何通过 Prompt 同时将一个 VLM 应用到多个任务上。
在这里插入图片描述
文中发现任务共享提示可以显著地补充为每个任务单独设计 (或学习) 的提示。单个任务 (手工制作) 提示捕获每个任务的细粒度内容。任务共享 (手工制作) 提示符表示跨任务的一般内容。任务共享和任务单独提示的组合可以包含多粒度的内容,以增强识别。
在这里插入图片描述
虽然相似的任务可以通过共享知识来促进彼此,但我们不能假设所有提供的任务都可以从一起训练中受益。任务之间的显著差异可能导致表现不佳,也被称为负迁移。另一方面,即使在理想的情况下,即在所有任务中存在相同的有益提示,仅学习全局 (粗粒度) 任务共享提示会忽略在一些细粒度任务中的信息。

Method

在这里插入图片描述

Learning Individual and Shared Knowledge

作者认为,任务独立的 Prompt 会出现过拟合的情况,而完全共享相同的 Prompt 则忽略了一部分的细粒度信息,因此同时学习任务共享和独立的 Prompt,同时提供总体和相关的内容来有效发挥 VLM 的效果。

Hierarchical Prompt Learning

在这里插入图片描述
HiPro 首先根据任务对的梯度方向估计任务间的affinity。在给定affinity的情况下,采用分层聚类的方法构造分层任务树。然后,HiPro 独立学习每个节点捕获相应任务组上迁移信息的提示。最后,对于每个目标任务,通过平均由任务相关提示 (由包含目标任务的任务组学习) 生成的权重来获得融合分类器权重。

Inter-Task Affinity

任务间affinity量化了两个任务的相似性,即两个任务可以从一起训练中获益的程度。现有的 MTL 研究表明,梯度冲突是联合训练导致性能下降的关键原因。因此通过两个任务在共享提示上的梯度的相似性来度量它们的affinity

具体来说,给定所有目标任务的全局任务共享提示符,则第 i i i 个任务与第 j j j 个任务之间的亲和度可计算为如下点积:

在这里插入图片描述

Hierarchical Task Clustering and Prompt Learning

给定任务间的affinity d τ i , d τ j d_{\tau_i}, d_{\tau_j} dτi,dτj,利用层次聚类构建层次任务树,从而发现任务间共享的较细粒度的知识。每个任务都被视为一个初始集群,迭代地找出两个最相似的簇,并将它们合并成一个新的簇。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
HIVT(Hierarchical Vector Transformer for Multi-Agent Motion Prediction)是一种用于多智能体运动预测的分层向量变换器。该模型使用了向量变换器(Vector Transformer)的层级架构,用于对多智能体的运动轨迹进行预测。 HIVT模型旨在解决多智能体之间相互影响和合作的问题。在多智能体系统中,智能体之间的运动和行为往往会相互影响,因此准确预测智能体的运动轨迹变得非常重要。传统的方法往往难以捕捉到智能体之间的复杂相互作用和外部环境的影响,而HIVT模型通过分层向量变换器的架构,可以更好地捕捉到多智能体系统中的相互作用。 HIVT模型首先使用一个全局的向量变换器来处理整个多智能体系统的运动轨迹,以捕捉全局的趋势和相互作用。然后,对于每个智能体,模型使用一个局部的向量变换器来预测其个体的运动轨迹,以考虑个体特定的动态特征和周围智能体的影响。 通过分层向量变换器的架构,HIVT模型能够更好地处理多智能体系统中的动态变化和相互作用,提高了运动轨迹预测的准确性。同时,该模型还可以应用于多个领域,如智能交通、无人机团队协作等。 总而言之,HIVT模型是一种基于分层向量变换器的多智能体运动预测方法,通过捕捉多智能体系统中的相互作用和全局趋势,提高了运动轨迹预测的准确性和适用性。该模型在多个领域具有广泛的应用前景。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值