lora体验

最新推荐文章于 2024-08-14 14:40:00 发布

Undefined游侠

最新推荐文章于 2024-08-14 14:40:00 发布

阅读量444

点赞数 4

文章标签： transformer

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_19859865/article/details/138695816

版权

项目链接

GitHub - cloneofsimo/lora: Using Low-rank adaptation to quickly fine-tune diffusion models.

现在如果想体验stable diffusion的lora功能，有很多种渠道吧，虽然lora是微软开源，但是cloneofsimo提供了适配stable diffusion的lora流程。

数据准备

我准备了20张葫芦娃的图片用于微调，没有什么特别操作。

微调

微调耗时很短，10分钟？

Code Review

代码基于cli_lora_pti.py 执行，针对输入的关键词，我们生成对应的token id. 其实就是建立embedding的映射了。

这里有点不理解的是，initialize_token_ids, place_token_ids的作用不太理解。。。

接下来，进入

PivotalTuningDatasetCapation

它的作用就是构建数据集。

接下来，还有inpaint的训练选项，这是一个我很感兴趣的功能。我们可以选择是使用inpainting_dataloader还是text2img_dataloader 加载数据

然后，我们设定require_grad为false。

   unet.requires_grad_(False)
    vae.requires_grad_(False)

接下来，我们可以选择是否进行inversion，如果选择训练inversion，我们会对于text encoder进行训练，

接下来，我们可以选择利用lora进行训练,这里可以选择是否使用extended lora进行训练，

然后，我们可以inspect_lora(什么意思呢？

最后，我们又一次进行tuning，对象为text_encoder和unet。并进行保存！我认为这个代码结构非常的清晰简洁，值得多看！

看什么呢？

有几个问题需要再梳理清楚

1. initialized_token_id和place holder token id是什么关系

2. inpaint 的操作如何进行？

3. inspect lora是什么操作？

4. inversion的细节

5. extended lora是什么操作？

6. unet微调的细节？

7. vae不需要微调吗？

Undefined游侠

关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Undefined游侠 CSDN认证博客专家 CSDN认证企业博客

码龄10年

75: 原创

4万+: 周排名

2万+: 总排名

3万+: 访问

: 等级

1175: 积分

329: 粉丝

421: 获赞

6: 评论

428: 收藏

私信

关注

热门文章

分类专栏

最新评论

数据结构与算法2 哈希表
CSDN-Ada助手: 算法技能树或许可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
EfficientAI Lab：大模型AWQ量化
weixin_46656063: 为什么做这个Scale操作呢？其实是为了减少量化损失，对于普通的权重量化，损失一般在于Round操作的舍入误差，一般浮点数的舍入值在0~0.5，平均误差就是0.25。而先scale再量化的公式如下，一般来说在对应的salient weight row乘上因子s并不会影响weight的极值，那么，而Round误差一般也是不变的，那么下式的Err相比于原先的Err会多出一个1/s，那么量化误差就变低。
Swin-Transformer论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
VIT论文阅读： A Image is Worth 16x16 Words
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
EfficientAI Lab：大模型AWQ量化
cooper6666: 咨询一下，为什么现在awq只支持Int4量化，而不支持int3或者int8量化呢？

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。