从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。
Datawhale官方的速通教程链接:Task 1 从零入门AI生图原理&实践
赛题内容
-
参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格......
-
基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义;基于8图故事,评估LoRA风格的美感度及连贯性
样例:偶像少女养成日记
Step1:报名赛事!(点击即可跳转)
赛事链接:https://tianchi.aliyun.com/competition/entrance/532254
点击报名比赛,即可报名成功
Step2:在魔搭社区创建PAI实例!(点击即可跳转)
Step3:30 分钟体验一站式 baseline!
-
下载baseline文件(大约需要2分钟)
-
进入文件夹,打开baseline文件
-
安装环境,然后重启kernel
安装 Data-Juicer 和 DiffSynth-Studio
Data-Juicer:数据处理和转换工具,旨在简化数据的提取、转换和加载过程
DiffSynth-Studio:高效微调训练大模型工具
-
调整prompt,设置你想要的图片风格,依次修改8张图片的描述(可选)
正向描述词:你想要生成的图片应该包含的内容
反向提示词:你不希望生成的图片的内容
-
依次顺序运行剩余的代码块,点击代码框左上角执行按钮,最终获得图片(大约需要20分钟)
下面的代码块按照功能主要分成这几类
-
使用Data-Juicer处理数据,整理训练数据文件
-
使用DiffSynth-Studio在基础模型上,使用前面整理好的数据文件进行训练微调
-
加载训练微调后的模型
-
使用微调后的模型,生成用户指定的prompt提示词的图片
-
Step4:微调结果上传魔搭(点击即可跳转)
链接:https://www.modelscope.cn/models/create
-
移动结果文件
创建terminal,粘贴如下命令,回车执行
mkdir /mnt/workspace/kolors/output & cd cp /mnt/workspace/kolors/models/lightning_logs/version_0/checkpoints/epoch\=0-step\=500.ckpt /mnt/workspace/kolors/output/ cp /mnt/workspace/kolors/1.jpg /mnt/workspace/kolors/output/
-
下载结果文件
双击进入output文件夹,分别下载两个文件到本地
-
创建并上传模型所需内容
点击魔搭链接,创建模型,中文名称建议格式:队伍名称-可图Kolors训练-xxxxxx
这样就算创建完成并发布在创空间讨论区了。
-
来到创空间,查看自己的模型是否发布
关闭PAI实例!!!!(点击即可跳转)
学习时间表
从零入门 文生图原理&实践学习规划表 | |||
---|---|---|---|
Task | Task 描述 | 相关知识点 | 学习安排 |
Task 1:4天 8月8日~8月11日 | 打怪难度:简单
| 开营直播 2024年/8月/11号 20:30 | |
Task 2:3天 8月12日~8月14日 | 打怪难度:⭐️
|
| Task2直播分享 2024年/8月13号 20:30 |
Task 3:3天 8月15日~8月17日 | 打怪难度:⭐️⭐️
|
| 赛事解读与上分直播分享 2024年/8月/17号 19:00 |
选学辅助材料 8月17日-8月20日 | 打怪难度:⭐️⭐️
|
|