前言
从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习——
- 适合想 入门并实践 AIGC文生图、工作流搭建、LoRA微调 的学习者参与
- 学习内容提要:从通过代码实现AI文生图逐渐进阶,教程偏重图像工作流、微调、图像优化等思路,最后会简单介绍AIGC应用方向、数字人技术(选学)
一、开通阿里云服务器
因为类似大模型这种需要微调的LLM项目,内存大,训练时间长,是非常吃gpu配置的,所以不建议在自己的本地部署,所以我们选择使用阿里云平台服务器,这样不仅可以用低配置的笔记本或电脑完成项目实施,并且为以后多人同时合作部署提供基础。
链接:https://free.aliyun.com/?productCode=learn
1.阿里云服务其部署
2.在魔塔中进行授权
链接:https://www.modelscope.cn/my/mynotebook/authorization
二、在魔搭社区创建PAI实例
创建实例
确认后点击下一步
创建实例,会返回魔塔,自动开始启动
三、创建好对应的服务器后就开始从git上拉取项目了
(1)下载baseline文件(大约需要2分钟)
代码如下(示例):
git lfs install
git clone https://www.modelscope.cn/datasets/maochase/kolors.git
(2)进入文件夹,打开baseline文件
(3)安装环境,然后重启kernel
安装 Data-Juicer 和 DiffSynth-Studio
Data-Juicer:数据处理和转换工具,旨在简化数据的提取、转换和加载过程
DiffSynth-Studio:高效微调训练大模型工具
(4)调整prompt,设置你想要的图片风格,依次修改8张图片的描述
正向描述词:你想要生成的图片应该包含的内容
反向提示词:你不希望生成的图片的内容
(5)依次顺序运行剩余的代码块,点击代码框左上角执行按钮,最终获得图片
总结
以上就是今天要讲的内容,本文仅仅简单介绍了阿里云服务器的创建及在魔塔上api的创建,其实在我们调用模型是,最主要api调用的是别人的大模型,而想要创建出更好的效果准确说更确切的效果,我们还要进行对模型的微调,这个是重中之重,在我们以后会学到。