Datawhale X 魔搭 AI夏令营 第四期 AIGC方向 task01 从零入门AI生图原理&实践

0 本期活动内容与赛题简介

        Datawhale 2024年AI夏令营第四期“AIGC”方向的学习活动为从零入门AI生图原理&实践,基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习,适合想入门并实践AIGC文生图、工作流搭建、LoRA微调的学习者参与。

        可图Kolors-LoRA风格故事挑战赛由阿里云天池主办,参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格等,基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义。评审基于8图故事,评估LoRA风格的美感度及连贯性。
样例:偶像少女养成日记

图1 可图Kolors-LoRA风格故事挑战赛作品样例(图源阿里云)

task01的任务为跑通baseline生成一组图像,根据datawhale提供的样例进行操作。

1 环境配置

阿里云免费试用 - 阿里云领取PAI-DSW试用实例:

图2 如何领取阿里云试用

魔搭社区​​​​​授权访问:

图3 如何授权魔搭社区访问云资源

创建PAI实例:

如何创建PAI实例

创建实例后打开实例,成功进入控制台即创建成功。

2 下载baseline文件,并按步骤下载环境

执行下面的命令下载baseline文件:

git lfs install
git clone https://www.modelscope.cn/datasets/maochase/kolors.git

图4 执行命令后下载了kolors文件夹

进入kolors文件夹,打开baseline.ipynb文件,按照提示进行环境安装:

图5 根据提示安装环境

安装完成后需要重启kernel,否则可能会导致报错:

图6 图中两个红框二选一均可执行重启

继续按提示执行命令,下载数据集等内容并训练模型:

图7 下载数据集,其余步骤截图略去

3 生成图像

调整“咒语”prompt,开始生成图像。其中,prompt为正向描述,表达了我们想要模型生成什么样的图像;negative prompt为反向提示词,表达了我们希望模型不要生成什么样的图像。执行baseline中的8组生成代码,即可生成8幅我们需要的图像。

图8 其中一幅图的prompt

图9 这组prompt生成的图像

4 将模型和图像上传到魔搭社区

执行以下命令将模型和第一张图保存到实例:

mkdir /mnt/workspace/kolors/output & cd 
cp /mnt/workspace/kolors/models/lightning_logs/version_0/checkpoints/epoch\=0-step\=500.ckpt /mnt/workspace/kolors/output/
cp /mnt/workspace/kolors/1.jpg /mnt/workspace/kolors/output/

将图片和模型文件复制到自己的设备中,在这里上传到魔搭社区:

图9 上传模型步骤(图源datawhale教程)

到这里baseline的运行就大功告成了,另外,记得报名可图Kolors-LoRA风格故事挑战赛哦!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值