0 本期活动内容与赛题简介
Datawhale 2024年AI夏令营第四期“AIGC”方向的学习活动为从零入门AI生图原理&实践,基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习,适合想入门并实践AIGC文生图、工作流搭建、LoRA微调的学习者参与。
可图Kolors-LoRA风格故事挑战赛由阿里云天池主办,参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格等,基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义。评审基于8图故事,评估LoRA风格的美感度及连贯性。
样例:偶像少女养成日记
图1 可图Kolors-LoRA风格故事挑战赛作品样例(图源阿里云)
task01的任务为跑通baseline生成一组图像,根据datawhale提供的样例进行操作。
1 环境配置
在阿里云免费试用 - 阿里云领取PAI-DSW试用实例:
图2 如何领取阿里云试用
在魔搭社区授权访问:
图3 如何授权魔搭社区访问云资源
创建PAI实例:
如何创建PAI实例
创建实例后打开实例,成功进入控制台即创建成功。
2 下载baseline文件,并按步骤下载环境
执行下面的命令下载baseline文件:
git lfs install
git clone https://www.modelscope.cn/datasets/maochase/kolors.git
图4 执行命令后下载了kolors文件夹
进入kolors文件夹,打开baseline.ipynb文件,按照提示进行环境安装:
图5 根据提示安装环境
安装完成后需要重启kernel,否则可能会导致报错:
图6 图中两个红框二选一均可执行重启
继续按提示执行命令,下载数据集等内容并训练模型:
图7 下载数据集,其余步骤截图略去
3 生成图像
调整“咒语”prompt,开始生成图像。其中,prompt为正向描述,表达了我们想要模型生成什么样的图像;negative prompt为反向提示词,表达了我们希望模型不要生成什么样的图像。执行baseline中的8组生成代码,即可生成8幅我们需要的图像。
图8 其中一幅图的prompt
图9 这组prompt生成的图像
4 将模型和图像上传到魔搭社区
执行以下命令将模型和第一张图保存到实例:
mkdir /mnt/workspace/kolors/output & cd
cp /mnt/workspace/kolors/models/lightning_logs/version_0/checkpoints/epoch\=0-step\=500.ckpt /mnt/workspace/kolors/output/
cp /mnt/workspace/kolors/1.jpg /mnt/workspace/kolors/output/
将图片和模型文件复制到自己的设备中,在这里上传到魔搭社区:
图9 上传模型步骤(图源datawhale教程)
到这里baseline的运行就大功告成了,另外,记得报名可图Kolors-LoRA风格故事挑战赛哦!