Datawhale X 魔搭 AI夏令营Day01

最新推荐文章于 2024-10-16 10:08:57 发布

xuanEpiphany29

最新推荐文章于 2024-10-16 10:08:57 发布

阅读量1k

点赞数 27

文章标签： ai绘画人工智能

本文链接：https://blog.csdn.net/xuanEpiphany29/article/details/141108304

版权

一、学习打卡

Datawhale

是以可图Kolors-LoRA风格故事挑战赛为依托

二、学习经历

在Datawhale X 魔搭 AI夏令营学习AI绘画之前，我一直使用绘世平台，对于夏令营里用的魔搭还是比较陌生，现在有幸踏入 Datawhale X 魔搭 AI 夏令营，期待在全新的环境中实现自我突破与成长。

三、AI绘画学习

1、AI绘画的学习模块包括以下几个方面

数据集收集与清洗：收集绘画作品的数据集，并进行数据清洗和处理，包括去除噪声、标注数据等。
特征提取与表示：使用图像处理技术提取绘画作品的特征，例如颜色、纹理、线条等，并将其转化为机器可理解的表示形式。
机器学习算法选择与训练：选择适合绘画领域的机器学习算法，例如卷积神经网络 (CNN)、生成对抗网络 (GAN)等，并进行算法的训练。
生成模型的设计与优化：设计绘画生成模型的架构，并进行模型优化，包括调整超参数、提升模型性能等。
创作样式与风格模仿：通过学习大师级画作的样式和风格，使AI能够模仿并生成类似的绘画作品。
创新与个性化创作：通过引入创新元素和个性化的训练策略，使AI能够独立创作独特的绘画作品。
评估与调优：对生成的绘画作品进行评估和反馈，优化模型性能，并提高生成作品的质量和多样性。

2、AI绘画类型

AI绘画分为两大类：文生图和图生图

(1)、文生图

文生图主要以SD系列基础模型为主，以及在其基础上微调的lora模型和人物基础模型等，以下是其关键要素：

1.提示词

提示词包括正向提示词和负向提示词（有时也叫逆向提示词）

正向提示词是指能够帮助我们更好理解或解决问题的信息或线索。它们通常是与问题相关的关键词或短语，可以引导我们找到正确的答案或解决方法。

负向提示词（逆向提示词）是指能够反向引导我们思考或排除选项的信息或线索。它们可能与问题相反或与问题无关，但可以帮助我们排除错误答案或方向，从而更接近正确答案

当然如果负向提示词不写AI也可以画出来，只不过精确度没有那么高，可能画出来没有脸的美女和五条腿的小狗、不知道几个头的蛇

提示词很重要，一般写法：主体描述，细节描述，修饰词，艺术风格，艺术家

主体描述: 描述图像的主要元素，如人、动物、建筑等。
细节描述: 对主体的具体细节进行描绘，如颜色、姿态、表情等。
修饰词: 添加形容词和副词，例如“梦幻的”、“充满活力的”等，增加图像的生动性。
艺术风格: 指定希望呈现的艺术风格，如“印象派”、“超现实主义”等。
艺术家: 参照特定艺术家的风格，可以让生成的图像更具个性化。

借用例子

【promts】Beautiful and cute girl, smiling, 16 years old, denim jacket, gradient background, soft colors, soft lighting, cinematic edge lighting, light and dark contrast, anime, super detail, 8k

美丽可爱的女孩，微笑，16岁，牛仔夹克，渐变背景，柔和色彩，柔和光线，电影边缘照明，明暗对比，动漫风格，超细节，8K

【负向prompts】(lowres, low quality, worst quality:1.2), (text:1.2), deformed, black and white,disfigured, low contrast, cropped, missing fingers

（低分辨率，低质量，最差质量:1.2），（文字:1.2），变形，黑白，畸形，低对比度，裁切，缺失手指

2.Lora

Stable Diffusion中的Lora（LoRA）模型是一种轻量级的微调方法，它代表了“Low-Rank Adaptation”，即低秩适应。需要明确的是，Lora 并非指单一的具体模型，而是代表了一类通过特定微调技术应用于基础模型的扩展应用。在 Stable Diffusion 这一强大的文本到图像合成模型的框架之下，Lora 被巧妙地用来对预训练好的大模型进行具有针对性的优化。通过这种方式，能够实现对特定主题、风格或任务的精细化控制，使得生成的图像更加符合创作者的预期和需求。

3.ComfyUI

ComfyUI 是一个工作流工具，其主要作用在于极大地简化和优化 AI 模型的配置和训练过程。它凭借直观的界面和高度集成的功能，为用户带来了极大的便利。在 ComfyUI 的助力下，用户可以轻松自如地进行模型微调，使模型更加契合自己的创作需求；高效地进行数据预处理，为后续的图像生成奠定坚实的基础；还能顺利地开展图像生成等任务，从而显著提高工作效率和生成效果，让创作者能够更加专注于创意的发挥和作品的完善。