【ICML2023】基于最优多任务插值的多模态基础模型迁移

文章提出π-调优,一种用于视觉、语言和视觉-语言任务的参数高效迁移学习方法。它利用任务相似性在统一空间中预测并插值参数,提升迁移学习的性能和鲁棒性,尤其在数据有限时。π-调优优于微调和其他方法,并提供了任务关系的可视化,且兼容多种参数高效专家结构。
摘要由CSDN通过智能技术生成

cd28465ae2a76d8f384b0353c93aec1f.png

来源:专知
本文为论文介绍,建议阅读5分钟在这项工作中,我们提出了一种通用的参数高效迁移学习方法。

0f5efaf29acf4ee49573e8e67fbb6790.png

基础模型在多任务学习方面取得了很大的进展,实现了统一的单模态和多模态任务接口。然而,在迁移学习过程中,这类多任务学习器的潜力尚未得到充分利用。在这项工作中,我们提出了一种通用的参数高效迁移学习方法,称为预测-插值调优(π-调优),适用于视觉、语言和视觉-语言任务。它汇集了从类似任务中学到的轻量级任务特定专家的参数,以帮助目标下游任务。任务相似性在统一的模态无关空间中进行预测,形成一个可扩展的图表来展示任务之间的关系。π-调优具有几个吸引人的优点。首先,它灵活地探索了相似任务之间的内部和跨模态可转移性,以提高迁移学习的准确性和鲁棒性,特别是在数据稀缺的情况下。其次,它为迁移学习提供了一种系统性解决方案,通过多任务预测-然后插值,兼容各种类型的参数高效专家,如提示和适配器。第三,对14个单模态和6个多模态数据集的任务级别相互利益的广泛研究表明,π-调优在全射击和低射击条件下均优于微调和其他参数高效迁移学习方法。任务图还使得跨模态任务可转移性的深入可解释分析成为可能。相关代码将在https://github.com/TencentARC/pi-Tuning 上提供。

d4a77282a4503f545caebd061d91814e.png

f34216ca08fb3d7c9f35585a71dfcdd7.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值