使用Lora微调LLM——笔记

最新推荐文章于 2024-09-10 17:22:42 发布

Li_RuiQi

最新推荐文章于 2024-09-10 17:22:42 发布

阅读量237

点赞数 1

文章标签：笔记人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Li_RuiQi/article/details/141721561

版权

Lora没有真正地“调”预训练的参数，而是增加了一个低秩矩阵。

思路：
LLM的预训练模型的权重很可能是满秩的，这代表几乎全部的权重都是有意义的。
Lora的目的就是用更少的权重（低秩的表达），来近似的代替原始的预训练满秩参数。（类似于PCA）

实现方案;

代码实现：

input_dim = 768 # 例如，预训练模型的隐藏大小
output_dim = 768 # 例如，层的输出大小
rank = 8 # 低秩适应的等级'r'
W = ... # 来自预训练网络的权重，形状为 input_dim x output_dim
W_A = nn.Parameter(torch.empty(input_dim, rank)) # LoRA权重A
W_B = nn.Parameter(torch.empty(rank, output_dim)) # LoRA权重B初始化LoRA权重
nn.init.kaiming_uniform_(W_A, a=math.sqrt(5))
nn.init.zeros_(W_B)

def regular_forward_matmul(x, W):
	h = x @ W
	return h

def lora_forward_matmul(x, W, W_A, W_B):
	h = x @ W # 常规矩阵乘法
	h += x @ (W_A @ W_B) * alpha # 使用缩放的LoRA权重
	return h

Reference:

一文读懂：LoRA实现大模型LLM微调_lora llm-CSDN博客

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
使用Lora微调LLM——笔记

Lora的目的就是用更少的权重（低秩的表达），来近似的代替原始的预训练满秩参数。LLM的预训练模型的权重很可能是满秩的，这代表几乎全部的权重都是有意义的。Lora没有真正地“调”预训练的参数，而是增加了一个低秩矩阵。
复制链接

扫一扫

Li_RuiQi

CSDN认证博客专家 CSDN认证企业博客

码龄3年

中国科学院大学

35: 原创

71万+: 周排名

3万+: 总排名

2万+: 访问

: 等级

609: 积分

472: 粉丝

233: 获赞

33: 评论

356: 收藏

私信

关注

热门文章

分类专栏

Bug 1篇
word小技巧 1篇

最新评论

故障诊断数据集（资源汇总）
Chenzhizzzccc: 找到了？
Frequency-domain MLPs
Li_RuiQi: 有时间可以安排一下. 具体有什么问题我们可以直接讨论。
Frequency-domain MLPs
爆焯丸子: 不知道作者是否跑通了这个代码，可否出一期博客讲解一下
Sim2Real两个源代码
思考实践: 这段代码定义了两个静态方法，用于处理图像和深度数据，以及生成点云，这些都是在机器人视觉处理和环境理解中常见的操作。 _bbox2mask方法：这个方法用于根据边界框（bbox）生成一个遮罩（mask），该遮罩在边界框内的区域为True，外部为False。参数image是输入的图像，bbox是边界框的坐标，格式通常为[中心点y坐标, 中心点x坐标, 高度, 宽度]。方法首先创建一个与输入图像第一个通道大小相同的零矩阵mask（假设图像是三维的，即宽x高x通道），数据类型为bool。然后，根据bbox的坐标，在mask上将对应的区域设为True，表示这部分是我们感兴趣的区域（即边界框内的区域）。最后返回这个遮罩。 base_cloud方法：这个方法用于将深度图转换为点云，并将点云数据与图像数据合并。参数image是RGB图像数据，depth是深度图数据，intrinsic是相机的内参矩阵，shift和end_pose是用于调整点云位置的参数（可能用于将点云从相机坐标系转换到机器人或世界坐标系中）。方法首先使用depth2cloud函数（这个函数没有在代码片段中给出，但其作用是根据深度图和相机内参生成点云）来将深度图转换为点云cam_cloud。然后，将点云数据cam_cloud（X, Y, Z坐标）和原图像数据image（R, G, B值）沿着最后一个维度（通道维度）连接起来，形成一个新的数据结构，其中包含了每个点的空间坐标和颜色信息。这两个方法展示了在处理机器人视觉任务时，如何从基本的图像和深度数据出发，进行遮罩生成和点云构建，以便进行进一步的分析和操作。
Sim2Real两个源代码
思考实践: 这段代码定义了一个名为 Solution 的类的初始化方法 (__init__)，用于设置和初始化一个机器人系统的各个组件以及一些相关的工作线程。以下是各部分的详细说明：初始化机器人硬件组件： self.arm = Arm(backend='ros')：创建一个机械臂对象，使用ROS（Robot Operating System）作为后端进行通信。 self.base = Base(backend='ros')：创建一个移动底座对象，也是使用ROS进行通信。 self.gripper = Gripper(backend='ros')：创建一个抓手（夹爪）对象，并随即打开抓手准备抓取物体。 self.camera = Camera(backend='ros')：创建一个相机对象，用于获取环境图像。初始化机器视觉组件： self.detector = Detector(model='grounding-dino')：初始化一个用于目标检测的模型，这里示例中使用的是grounding-dino模型。也提供了注释掉的选择，即使用yolo-v7模型。 self.segmentor = Segmentor(model='segment-anything')：初始化一个用于图像分割的模型，可以分割图像中的任何物体。 self.grasper = GraspPredictor(model='graspnet')：初始化一个用于预测抓取位置的模型，这里使用的是graspnet。初始化多线程和同步锁： self.image_lock、self.result_lock、self.prompt_lock：分别为图像数据、处理结果和提示信息创建锁，用于在多线程环境中同步访问这些资源。 self.running = True：设置一个运行状态标志，用于控制线程的运行。 self.prompt = 'sky'：初始化一个提示信息，这可能用于指导目标检测模型识别特定类型的物体。 self.update_once()：执行一次更新操作，可能用于获取初始的图像和处理结果。 self.t_vis = Thread(target=self.vis, daemon=True)：创建一个视觉显示的线程，用于实时显示图像和检测结果。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。