背景介绍
AIGC技术
AIGC(AI-Generated Content)是指基于生成对抗网络、大型预训练模型等人工智能的技术方法,通过已有数据的学习和识别,以适当的泛化能力生成相关内容的技术。例如,通过输入关键词、描述或样本,AIGC可以生成与之相匹配的文章、图像、音频等。
Deepfake技术
Deepfake是一种使用人工智能技术生成的伪造媒体,特别是视频和音频,它们看起来或听起来非常真实,但实际上是由计算机生成的。这种技术通常涉及到深度学习算法,特别是生成对抗网络(GANs),它们能够学习真实数据的特征,并生成新的、逼真的数据。
工具箱合集
此次比赛内容是,参赛者需在可图Kolors 模型的基础上,基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义,风格不限,同时要保证美感度及连贯性。 与之前活动不同的是,第二期CV图像方向任务是检测图像是否为Deepfake图像,而此次第四期AIGC方向的任务是基于模型生成AI图像。
将教程中的常用链接如下,正常使用的前提是已经按要求完成相应的注册与申请资源。
Datawhale速通教程:Datawhale (linklearner.com)
AI云开发平台(PAI-DSW):我的Notebook · 魔搭社区 (modelscope.cn)https://modelscope.cn/my/mynotebook/authorization
AI助教(通义千问):
通义tongyi.ai_你的全能AI助手 (aliyun.com)https://tongyi.aliyun.com/qianwen/比赛讨论区:可图Kolors-LoRA风格故事挑战赛_魔搭社区https://modelscope.cn/brand/view/Kolors?spm=a2c22.12281976.0.0.25381acbkEiZSp&branch=0&tree=11
baseline精读
1、安装依赖包
!pip install命令来安装Python 包,!pip uninstall命令用来卸载Python 包,
相关依赖包有:Data-Juicer 和 DiffSynth-Studio。
2、数据集下载与预处理
从ModelScope加载一个名为lowres_anime的数据集,并保存图像到指定目录。
将数据集中的图像转换为 RGB 模式,并保存到指定目录。
创建包含图像路径和文本描述的元数据文件 metadata.jsonl。
编写并保存 data_juicer_config.yaml 配置文件,用于后续的数据过滤和处理。
3、用Data-Juicer进行数据处理
使用 dj-process 命令根据配置文件对数据进行过滤和处理,生成 result.jsonl 文件。
读取 result.jsonl 文件中的数据,并将其转换为 Pandas DataFrame,然后保存为 CSV 文件,并且将图片保存到指定文件夹下。
4、模型训练与图像生成
下载可图模型download_models(["Kolors", "SDXL-vae-fp16-fix"])。
在前面模型的基础上,执行可图Lora微调训练。
加载Lora微调后的模型。
设置正向提示词,反向提示词,执行次数,图片尺寸。
设置随机种子,控制图片是否可以重复生成,并将图像保存为 .jpg 文件。
5、合并图像
将生成的多个图像合并成一个大图像,并调整图片的大小。
baseline改进
修改了提示词,根据生成的图像进行改进。
初遇
青年男子笑容可掬,手捧布匹,前来与女子交易,实则为了接近她,商讨婚事。
相恋
女子翘首以盼,等待男子归来,见到他时喜极而泣,两人重逢后欢声笑语不断。
婚姻
占卜显示吉祥,没有不利的预兆,男子驾车迎接,女子带着嫁妆,两人步入婚姻殿堂。
辛劳
女子三年来辛勤操持家务,从早忙到晚,没有一刻停歇,展现了她的勤劳和牺牲。
变化
男子性格反复无常,对待女子的态度时好时坏,不再如从前般专一和温柔。
哀怨
女子静下心来反思这段关系,内心充满悲痛和自我怜悯,意识到自己的处境。
决绝
女子下定决心,不再回头,面对男子的背叛,她选择了放弃和决裂。
新生
女子告诫后来者不要沉溺于爱情,因为男子可以轻易抽身,而女子一旦深陷其中,便难以自拔,暗示了她正迈向新的生活阶段,学会了独立和自我保护。