基于魔搭平台的从零入门AI生图原理&实践是2024暑期Datawhale AI夏令营开展的第四期AIGC方向的学习内容。本期学习以魔搭社区的可图Kolors-LoRA风格故事挑战赛为例开展。速通手册会放到文末。
赛题内容
- 参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格…
- 基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义;基于8图故事,评估LoRA风格的美感度及连贯性。样例:偶像少女养成日记
赛前准备
在开始比赛之前,需要先配置好运行环境。这里速通手册写得很详细。有一点需要说明,要是之前开过阿里PAI-DSW的同学可能没办法免费获取实用算力,这种情况,同学们可以选择其他算力方案比如魔搭可以提供免费GPU额度,这里注意多模态数据合成执行是不能采用这个方案的。
在这里给大家一个小提醒,尤其是对平台不太熟悉的同学:建议大家在配置环境的过程中,一定要仔细参照手册按照指引进行不要因为漏看信息导致配置错误,这方面手册操作步骤和配图是很详细。
配置好后我们就可以启动实例后打开它了,接下来就是进入正题跑baseline了。
30min速通baseline
哈哈对于第一次运行baseline来说,这个就有点标题党了。其实操作很简单,就是一键从头点击运行到尾。但第一次运行baseline的话,第一步就是一个坎(在这里不是说它难,而是耗时是真的longlonglong),这一步运行完大概用了我20分钟吧。跑完baseline我大概一共用了一个半小时。
虽然耗时比较长,但结果很good。
下面是baseline的运行结果
然后我对prompt做了一个小修改,生成了如下图片
对了,有一点需要提醒。代码运行需要一段一段进行,不能上一段还没运行结束,就运行下一段。
最后需要提交如下两个文件
然后baseline的跑通就结束啦,最后大家不要忘记关闭实例
如果不关闭的话,算力会一直处于消耗状态的。
好啦今天的分享结束~
最后速通手册放到这里啦:从零入门AI生图原理&实践