赛事链接:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的成绩 (aliyun.com)
要求:
-
参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格......
-
基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义;基于8图故事,评估LoRA风格的美感度及连贯性 样例:偶像少女养成日记
task1任务要求
根据步骤将代码文件跑一遍即可
具体步骤
1.下载baseline文件
git lfs install
git clone https://www.modelscope.cn/datasets/maochase/kolors.git
2.下载完成后打开文件夹中的baseline代码文件
3.运行代码文件中的第一步安装。安装完成后重启一下服务,即代码文件中全部运行按键旁边的类似于刷新的按键。
4.通过调整提示词可以进行不同风格的文生图
5.运行剩余全部代码块,即可获得最终图片
将微调后的结果上传即可。
以上为task1主要内容,下面为task2主要内容,task2的主要内容为利用大模型来定制提示词,这样可以节省时间,同时好的大模型也能更好地提供相关提示词,task2所用大模型为通义大模型,经过几个常用的大模型的对比,claude和gpt4o个人体验不错,相较于其他大模型而言不需要提供更多的微调,国内文心4.0使用较佳。
在此处建议大家多去实验几个,选择自己顺手的大模型使用体验更佳。在baseline代码中修改提示词即可。