Datawhale X 魔搭 AI夏令营Day01

一、学习打卡

Datawhale

是以可图Kolors-LoRA风格故事挑战赛为依托

二、学习经历

在Datawhale X 魔搭 AI夏令营学习AI绘画之前,我一直使用绘世平台,对于夏令营里用的魔搭还是比较陌生,现在有幸踏入 Datawhale X 魔搭 AI 夏令营,期待在全新的环境中实现自我突破与成长。

三、AI绘画学习

1、AI绘画的学习模块包括以下几个方面

  1. 数据集收集与清洗:收集绘画作品的数据集,并进行数据清洗和处理,包括去除噪声、标注数据等。

  2. 特征提取与表示:使用图像处理技术提取绘画作品的特征,例如颜色、纹理、线条等,并将其转化为机器可理解的表示形式。

  3. 机器学习算法选择与训练:选择适合绘画领域的机器学习算法,例如卷积神经网络 (CNN)、生成对抗网络 (GAN)等,并进行算法的训练。

  4. 生成模型的设计与优化:设计绘画生成模型的架构,并进行模型优化,包括调整超参数、提升模型性能等。

  5. 创作样式与风格模仿:通过学习大师级画作的样式和风格,使AI能够模仿并生成类似的绘画作品。

  6. 创新与个性化创作:通过引入创新元素和个性化的训练策略,使AI能够独立创作独特的绘画作品。

  7. 评估与调优:对生成的绘画作品进行评估和反馈,优化模型性能,并提高生成作品的质量和多样性。

2、AI绘画类型

AI绘画分为两大类:文生图和图生图

(1)、文生图

文生图主要以SD系列基础模型为主,以及在其基础上微调的lora模型和人物基础模型等,以下是其关键要素:

1.提示词

提示词包括正向提示词和负向提示词(有时也叫逆向提示词)

正向提示词是指能够帮助我们更好理解或解决问题的信息或线索。它们通常是与问题相关的关键词或短语,可以引导我们找到正确的答案或解决方法。

负向提示词(逆向提示词)是指能够反向引导我们思考或排除选项的信息或线索。它们可能与问题相反或与问题无关,但可以帮助我们排除错误答案或方向,从而更接近正确答案

当然如果负向提示词不写AI也可以画出来,只不过精确度没有那么高,可能画出来没有脸的美女和五条腿的小狗、不知道几个头的蛇

提示词很重要,一般写法:主体描述,细节描述,修饰词,艺术风格,艺术家

  • 主体描述: 描述图像的主要元素,如人、动物、建筑等。
  • 细节描述: 对主体的具体细节进行描绘,如颜色、姿态、表情等。
  • 修饰词: 添加形容词和副词,例如“梦幻的”、“充满活力的”等,增加图像的生动性。
  • 艺术风格: 指定希望呈现的艺术风格,如“印象派”、“超现实主义”等。
  • 艺术家: 参照特定艺术家的风格,可以让生成的图像更具个性化。

借用例子

promts】Beautiful and cute girl, smiling, 16 years old, denim jacket, gradient background, soft colors, soft lighting, cinematic edge lighting, light and dark contrast, anime, super detail, 8k

美丽可爱的女孩,微笑,16岁,牛仔夹克,渐变背景,柔和色彩,柔和光线,电影边缘照明,明暗对比,动漫风格,超细节,8K

负向prompts】(lowres, low quality, worst quality:1.2), (text:1.2), deformed, black and white,disfigured, low contrast, cropped, missing fingers

(低分辨率,低质量,最差质量:1.2),(文字:1.2),变形,黑白,畸形,低对比度,裁切,缺失手指

2.Lora

Stable Diffusion中的Lora(LoRA)模型是一种轻量级的微调方法,它代表了“Low-Rank Adaptation”,即低秩适应。需要明确的是,Lora 并非指单一的具体模型,而是代表了一类通过特定微调技术应用于基础模型的扩展应用。在 Stable Diffusion 这一强大的文本到图像合成模型的框架之下,Lora 被巧妙地用来对预训练好的大模型进行具有针对性的优化。通过这种方式,能够实现对特定主题、风格或任务的精细化控制,使得生成的图像更加符合创作者的预期和需求。

3.ComfyUI

ComfyUI 是一个工作流工具,其主要作用在于极大地简化和优化 AI 模型的配置和训练过程。它凭借直观的界面和高度集成的功能,为用户带来了极大的便利。在 ComfyUI 的助力下,用户可以轻松自如地进行模型微调,使模型更加契合自己的创作需求;高效地进行数据预处理,为后续的图像生成奠定坚实的基础;还能顺利地开展图像生成等任务,从而显著提高工作效率和生成效果,让创作者能够更加专注于创意的发挥和作品的完善。

(2)、图生图

图生图则是通过已有图像进行加工或生成新图像,增加了创作的多样性和灵活性。

在图生图的过程中,首先需要选择一张合适的原始图像作为基础。这张原始图像可以是自己拍摄的照片、从网络上获取的图片或者是之前创作的作品。它将成为后续创作的起点和灵感来源。

可以对图像的构图进行修改

3、零代码文生图Lora模型训练

魔搭某种程度上蛮方便的,不知道是不是版本不一样,我用的绘世不需要手动跑,只要输入提示词就行了

让我们一键开始使用魔搭的图像模型训练工具(点击跳转工具)

训练步骤如下:

Step 1: 创建与命名模型

  • 点击“创建新模型”,为您的模型起一个独特且易记的名字。
  • 这有助于您在后续使用过程中快速识别。

Step 2: 上传训练数据

  • 准备您的训练图片。推荐上传多样化且高质量的图像,以提高模型的表现。
  • 按照平台要求的格式上传图片,确保数据干净、无水印。

Step 3: 设置训练参数

  • 根据需求选择合适的训练参数,比如学习率、迭代次数等。建议使用默认设置,初学者可以从中获得良好的结果。

Step 4: 开始训练

  • 提交模型训练请求,系统会自动开始训练过程。您可以在平台上查看训练进度。

Step 5: 训练完成

  • 训练完成后,您会收到通知。在模型管理界面中,可以查看训练结果和模型评估指标。

以上就是我学习第一天的收获

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值