一、学习打卡
是以可图Kolors-LoRA风格故事挑战赛为依托
二、学习经历
在Datawhale X 魔搭 AI夏令营学习AI绘画之前,我一直使用绘世平台,对于夏令营里用的魔搭还是比较陌生,现在有幸踏入 Datawhale X 魔搭 AI 夏令营,期待在全新的环境中实现自我突破与成长。
三、AI绘画学习
1、AI绘画的学习模块包括以下几个方面
-
数据集收集与清洗:收集绘画作品的数据集,并进行数据清洗和处理,包括去除噪声、标注数据等。
-
特征提取与表示:使用图像处理技术提取绘画作品的特征,例如颜色、纹理、线条等,并将其转化为机器可理解的表示形式。
-
机器学习算法选择与训练:选择适合绘画领域的机器学习算法,例如卷积神经网络 (CNN)、生成对抗网络 (GAN)等,并进行算法的训练。
-
生成模型的设计与优化:设计绘画生成模型的架构,并进行模型优化,包括调整超参数、提升模型性能等。
-
创作样式与风格模仿:通过学习大师级画作的样式和风格,使AI能够模仿并生成类似的绘画作品。
-
创新与个性化创作:通过引入创新元素和个性化的训练策略,使AI能够独立创作独特的绘画作品。
-
评估与调优:对生成的绘画作品进行评估和反馈,优化模型性能,并提高生成作品的质量和多样性。
2、AI绘画类型
AI绘画分为两大类:文生图和图生图
(1)、文生图
文生图主要以SD系列基础模型为主,以及在其基础上微调的lora模型和人物基础模型等,以下是其关键要素:
1.提示词
提示词包括正向提示词和负向提示词(有时也叫逆向提示词)
正向提示词是指能够帮助我们更好理解或解决问题的信息或线索。它们通常是与问题相关的关键词或短语,可以引导我们找到正确的答案或解决方法。
负向提示词(逆向提示词)是指能够反向引导我们思考或排除选项的信息或线索。它们可能与问题相反或与问题无关,但可以帮助我们排除错误答案或方向,从而更接近正确答案
当然如果负向提示词不写AI也可以画出来,只不过精确度没有那么高,可能画出来没有脸的美女和五条腿的小狗、不知道几个头的蛇
提示词很重要,一般写法:主体描述,细节描述,修饰词,艺术风格,艺术家
- 主体描述: 描述图像的主要元素,如人、动物、建筑等。
- 细节描述: 对主体的具体细节进行描绘,如颜色、姿态、表情等。
- 修饰词: 添加形容词和副词,例如“梦幻的”、“充满活力的”等,增加图像的生动性。
- 艺术风格: 指定希望呈现的艺术风格,如“印象派”、“超现实主义”等。
- 艺术家: 参照特定艺术家的风格,可以让生成的图像更具个性化。
借用例子
【promts】Beautiful and cute girl, smiling, 16 years old, denim jacket, gradient background, soft colors, soft lighting, cinematic edge lighting, light and dark contrast, anime, super detail, 8k
美丽可爱的女孩,微笑,16岁,牛仔夹克,渐变背景,柔和色彩,柔和光线,电影边缘照明,明暗对比,动漫风格,超细节,8K
【负向prompts】(lowres, low quality, worst quality:1.2), (text:1.2), deformed, black and white,disfigured, low contrast, cropped, missing fingers
(低分辨率,低质量,最差质量:1.2),(文字:1.2),变形,黑白,畸形,低对比度,裁切,缺失手指
2.Lora
Stable Diffusion中的Lora(LoRA)模型是一种轻量级的微调方法,它代表了“Low-Rank Adaptation”,即低秩适应。需要明确的是,Lora 并非指单一的具体模型,而是代表了一类通过特定微调技术应用于基础模型的扩展应用。在 Stable Diffusion 这一强大的文本到图像合成模型的框架之下,Lora 被巧妙地用来对预训练好的大模型进行具有针对性的优化。通过这种方式,能够实现对特定主题、风格或任务的精细化控制,使得生成的图像更加符合创作者的预期和需求。
3.ComfyUI
ComfyUI 是一个工作流工具,其主要作用在于极大地简化和优化 AI 模型的配置和训练过程。它凭借直观的界面和高度集成的功能,为用户带来了极大的便利。在 ComfyUI 的助力下,用户可以轻松自如地进行模型微调,使模型更加契合自己的创作需求;高效地进行数据预处理,为后续的图像生成奠定坚实的基础;还能顺利地开展图像生成等任务,从而显著提高工作效率和生成效果,让创作者能够更加专注于创意的发挥和作品的完善。
(2)、图生图
图生图则是通过已有图像进行加工或生成新图像,增加了创作的多样性和灵活性。
在图生图的过程中,首先需要选择一张合适的原始图像作为基础。这张原始图像可以是自己拍摄的照片、从网络上获取的图片或者是之前创作的作品。它将成为后续创作的起点和灵感来源。
可以对图像的构图进行修改
3、零代码文生图Lora模型训练
魔搭某种程度上蛮方便的,不知道是不是版本不一样,我用的绘世不需要手动跑,只要输入提示词就行了
让我们一键开始使用魔搭的图像模型训练工具(点击跳转工具)
训练步骤如下:
Step 1: 创建与命名模型
- 点击“创建新模型”,为您的模型起一个独特且易记的名字。
- 这有助于您在后续使用过程中快速识别。
Step 2: 上传训练数据
- 准备您的训练图片。推荐上传多样化且高质量的图像,以提高模型的表现。
- 按照平台要求的格式上传图片,确保数据干净、无水印。
Step 3: 设置训练参数
- 根据需求选择合适的训练参数,比如学习率、迭代次数等。建议使用默认设置,初学者可以从中获得良好的结果。
Step 4: 开始训练
- 提交模型训练请求,系统会自动开始训练过程。您可以在平台上查看训练进度。
Step 5: 训练完成
- 训练完成后,您会收到通知。在模型管理界面中,可以查看训练结果和模型评估指标。
以上就是我学习第一天的收获