lora为什么可以合并进原始模型?

import torch

#这是输入数据,维度为100,长度为120
tensor = torch.rand(120, 100)
#这是一个线性层
matrix0 = torch.rand(100, 100)

# 这是一个lora
matrix1 = torch.rand(100, 10)
matrix2 = torch.rand(10, 100)
#1、120*100的矩阵与100*10相乘,输出再和10*100的矩阵相乘
ouput1= torch.mm(torch.mm(tensor, matrix1),matrix2)+torch.mm(tensor,matrix0)
#2、120*100的矩阵与100*10和10*100的矩阵先转换为100*100的低秩方阵相乘
ouput2= torch.mm(tensor, torch.mm(matrix1,matrix2))+torch.mm(tensor,matrix0)
#1和2结果相同
print(torch.allclose(ouput1, ouput2)) # True
#我们把低秩方阵提前与线性层相加
ouput3= torch.mm(tensor, torch.mm(matrix1,matrix2)+matrix0)
#发现提前相加的结果与分开运算结果相同,这就是为什么lora可以合并进原始模型
print(torch.allclose(ouput1, ouput3)) # True

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值