《论文阅读》LORA：大型语言模型的低秩自适应 2021

最新推荐文章于 2024-06-25 21:55:09 发布

365JHWZGo

最新推荐文章于 2024-06-25 21:55:09 发布

阅读量1.1k

点赞数

分类专栏：组会论文文章标签： 1024程序员节论文阅读语言模型低秩自适应

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44833392/article/details/134014295

版权

组会论文专栏收录该内容

31 篇文章 12 订阅 ¥29.90 ¥99.00

订阅专栏

《论文阅读》LORA: LOW-RANK ADAPTATION OF LARGE LAN-GUAGE MODELS

- - 前言

前言

今天为大家带来的是《LORA: LOW-RANK ADAPTATION OF LARGE LAN-GUAGE MODELS》

在这里插入图片描述

出版：

时间：2021年10月16日

类型：大语言模型的微调方法

关键词：

作者：Edward Hu, Yelong Shen 等

第一作者机构：Microsoft Corporation

github：https://github.com/microsoft/LoRA

简介

为了降低现有模型在下游任务上的计算成本和时间成本，本文提出一种利用低秩的矩阵的方法，将高维空间映射到低维空间，在减小成本的同时不损失模型表现，下图为常见大语言预训练模型在下游任务上的实现机制，通常一个任务有多少个不同的数据集就需要保留多少个备份模型，这样是非常不划算的。因此本文提出了低秩自适应 (Low-Rank Adaptation, LoRA)，它冻结了预训练的模型权重，并将可训练的秩分解矩阵注入到 Transformer 架构的每一层，极大地减少了下游任务的可训练参数的数量，有效提升预训练模型在下游任务上的 finetune 效率

现有方法

了解本专栏

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
《论文阅读》LORA：大型语言模型的低秩自适应 2021

今天为大家带来的是《LORA: LOW-RANK ADAPTATION OF LARGE LAN-GUAGE MODELS》出版：时间：2021年10月16日类型：大语言模型的微调方法关键词：作者：Edward Hu, Yelong Shen 等第一作者机构：Microsoft Corporation。
复制链接

扫一扫

专栏目录

365JHWZGo CSDN认证博客专家 CSDN认证企业博客

码龄5年

544: 原创

1万+: 周排名

6289: 总排名

36万+: 访问

: 等级

5783: 积分

5619: 粉丝

195: 获赞

135: 评论

689: 收藏

私信

关注

热门文章

分类专栏

最新评论

《论文阅读》通过顺序不敏感的表示正则化实现稳健的个性化对话生成 ACL 2023
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
《论文阅读》具有人格自适应注意的个性化对话生成 AAAI 2023
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
《论文阅读》学习了解自己：一个粗略到精细的个性化对话生成的人物感知训练框架 AAAI 2023
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读》通过混合潜在变量实现多样化、相关和连贯的开放领域对话生成 AAAI 2023
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
《论文阅读》MISC：一个融合COMET的情感支持会话混合策略感知模型 ACL 2022
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

365JHWZGo 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。