Prefix-Tuning: Optimizing Continuous Prompts for Generation

最新推荐文章于 2024-07-20 10:27:06 发布

Tsukinousag1

最新推荐文章于 2024-07-20 10:27:06 发布

阅读量1.1k

点赞数

文章标签：人工智能机器学习 java python 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42411502/article/details/123420904

版权

本文提出了一种名为前缀调整的方法，用于替代传统的模型微调。该方法保持大型语言模型参数不变，仅优化一个连续的任务特定向量，类似于虚拟tokens的前缀。通过冻结Transformer的参数，只需存储每个任务的前缀，从而实现模块化并节省存储空间。此技术有助于简化多任务学习，提高效率。

摘要由CSDN通过智能技术生成

在本文中，提出了前缀调整，一种轻量级的fine-tune替代方案，它使语言模型参数保持不变，但优化了一个小的连续特定任务向量(continuous task-specific vector)，一种类似于虚拟tokens的前缀

冻结transformer参数，只优化prefix(红色前缀块)。只需要为每个任务存储前缀，从而使前缀调整模块化，并且节省空间。每个垂直块都表示transformer在一个时间步上的激活情况

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Prefix-Tuning: Optimizing Continuous Prompts for Generation

在本文中，提出了前缀调整，一种轻量级的fine-tune替代方案，它使语言模型参数保持不变，但优化了一个小的连续特定任务向量(continuous task-specific vector)，一种类似于虚拟tokens的前缀冻结transformer参数，只优化prefix(红色前缀块)。只需要为每个任务存储前缀，从而使前缀调整模块化，并且节省空间。每个垂直块都表示transforme...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。