Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1随笔

目录

前言:

一、Datawhale AI夏令营简单介绍:

二、Datawhale AI夏令营学习课程

AIGC方向:

大模型应用开发方向:

多模态大模型(数据合成):

三、报名二维码

Task1:

一、赛题解读:

二、文生图:

1、历史

2、基础知识介绍

(1)提示词

(2)Lora

(3)ComfyUI

(4)参考图控制

三、初试AIGC

完整版:

简洁版:

四、成果展示

第一版:

第二版:

五、在使用中的注意事项

六、总结(经典碎碎念)


前言:

一、Datawhale AI夏令营简单介绍:

        Datawhale Al夏令营是一个在暑期举办的大规模AI学习活动,旨在汇聚产学研资源和开源社区力量,为学习者提供丰富的学习和实践机会,提升他们的专业能力和就业竞争力。2023年,这个夏令营吸引了来自全球1387所高校的18827名学习者参与,成为国内规模最大的AI夏令营之一。

        这次的AIGC之旅实在是让二次元狂喜,真心大喊一句“Datawhale AI Summer Campは最高です!” (๑˃ᴗ˂)ﻭ

二、Datawhale AI夏令营学习课程

AIGC方向:

        1.AI生图全流程体验

        2.AI生图原理与应用

        3.AI生图作品创作

        4.作品分享交流&展示

大模型应用开发方向:

        1.大模型应用开发实践&能力认证

        2.头脑风暴会&开发组队

        3.RAG技术原理与应用

        4.微调技术原理与应用

多模态大模型(数据合成):

        1.多模态大模型数据合成实践

        2.实践代码逐行精解

        3.数据合成方案迭代

        4.上分技巧与思路交流

三、报名二维码


Task1:

一、赛题解读:

本次参加的是天池-创新创业应用-可图Kolors-LoRA风格故事挑战赛,链接附下:

可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制 (aliyun.com)icon-default.png?t=N7T8https://tianchi.aliyun.com/competition/entrance/532254

二、文生图:

1、历史

文生图(Text-to-Image Generation)是一种通过文本生成图像的技术,其发展历程可以追溯到早期的计算机视觉和自然语言处理研究。这一技术的历史可以分为几个关键阶段:

发展阶段

发展介绍

早期探索

(20世纪60年代-20世纪90年代)

文生图的概念最早出现于计算机视觉和图像处理的早期研究中。

早期的图像生成技术主要依赖于规则和模板匹配,通过预定义的规则将文本转换为简单的图形。

然而,由于计算能力和算法的限制,这一阶段的技术能力非常有限,生成的图像质量较低,应用场景也非常有限。

基于统计模型的方法

(2000年代)

进入2000年代,随着统计模型和机器学习技术的发展,文生图技术开始得到更多关注。

研究者们开始利用概率图模型和统计语言模型来生成图像。尽管这一阶段的技术在生成图像的多样性和质量上有了一定提升,但由于模型的复杂性和计算资源的限制,生成的图像仍然较为粗糙,不够逼真。

深度学习的崛起

(2010年代)

2010年代是文生图技术发展的一个重要转折点。随着深度学习,尤其是卷积神经网络(CNN)和生成对抗网络(GAN)的发展,文生图技术取得了突破性进展。2014年,Goodfellow等人提出的GAN模型通过生成器和判别器的对抗训练,极大地提升了图像生成的质量。随后,各类变种GAN模型被提出,如DCGAN、Pix2Pix等,使得文生图技术在生成逼真图像方面达到了前所未有的高度。

大规模预训练模型

(2020年代)

进入2020年代,大规模预训练模型如OpenAI的CLIP、DALL-E以及Stable Diffusion等的出现,标志着文生图技术进入了一个新的时代。

CLIP通过大规模的文本和图像配对数据训练,能够理解和生成高度一致的文本和图像;DALL-E和Stable Diffusion进一步提升了生成图像的创意和细节表现能力,使得通过简单的文本描述生成高质量、复杂图像成为可能。

这些技术的应用范围从艺术创作、广告设计到辅助医疗诊断,展现了广泛的商业价值和社会影响力。

2、基础知识介绍

文生图主要以SD系列基础模型为主,以及在其基础上微调的lora模型和人物基础模型等。

(1)提示词

提示词很重要,一般写法:主体描述,细节描述,修饰词,艺术风格,艺术家

举个例子

promts】Beautiful and cute girl, smiling, 16 years old, denim jacket, gradient background, soft colors, soft lighting, cinematic edge lighting, light and dark contrast, anime, super detail, 8k

负向prompts】(lowres, low quality, worst quality:1.2), (text:1.2), deformed, black and white,disfigured, low contrast, cropped, missing fingers

(2)Lora

Stable Diffusion中的Lora(LoRA)模型是一种轻量级的微调方法,它代表了“Low-Rank Adaptation”,即低秩适应。Lora不是指单一的具体模型,而是指一类通过特定微调技术应用于基础模型的扩展应用。在Stable Diffusion这一文本到图像合成模型的框架下,Lora被用来对预训练好的大模型进行针对性优化,以实现对特定主题、风格或任务的精细化控制。

(3)ComfyUI

ComfyUI 是一个工作流工具,主要用于简化和优化 AI 模型的配置和训练过程。通过直观的界面和集成的功能,用户可以轻松地进行模型微调、数据预处理、图像生成等任务,从而提高工作效率和生成效果。

在ComfyUI平台的前端页面上,用户可以基于节点/流程图的界面设计并执行AIGC文生图或者文生视频的pipeline。

(4)参考图控制

ControlNet是一种用于精确控制图像生成过程的技术组件。它是一个附加到预训练的扩散模型(如Stable Diffusion模型)上的可训练神经网络模块。扩散模型通常用于从随机噪声逐渐生成图像的过程,而ControlNet的作用在于引入额外的控制信号,使得用户能够更具体地指导图像生成的各个方面(如姿势关键点、分割图、深度图、颜色等)。

参考图控制类型

简介

示例

OpenPose姿势控制

输入是一张姿势图片(或者使用真人图片提取姿势)作为AI绘画的参考图,输入prompt后,之后AI就可以依据此生成一副相同姿势的图片;

Canny精准绘制

输入是一张线稿图作为AI绘画的参考图,输入prompt后,之后AI就可以根据此生成一幅根据线稿的精准绘制。

Hed绘制

Hed是一种可以获取渐变线条的线稿图控制方式,相比canny更加的灵活。

深度图Midas

输入是一张深度图,输入prompt后,之后AI就可以根据此生成一幅根据深度图的绘制。

颜色color控制

通过参考图控制和颜色控制,实现更加精准和个性化的图像生成效果。

三、初试AIGC

这一块已经有人写的非常详细了,故不再过多赘述,链接如下:

完整版:

Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记-CSDN博客icon-default.png?t=N7T8https://blog.csdn.net/qq_74869852/article/details/140971871

简洁版:

AIGC的第一次尝试#Datawhale AI夏令营第四期#有奖赛事-CSDN博客文章浏览阅读367次,点赞13次,收藏6次。在这次AIGC(Artificial Intelligence Generated Content,人工智能生成内容)训练营中,我经历了一次激动人心的学习与实践之旅,成功利用AI技术生成了八幅充满创意与个性化的图像作品。这次经历不仅深化了我对AI生成艺术的理解,也让我亲身体验到了科技与艺术融合的无限可能。一、任务概述本次训练营的核心任务是通过输入关键词(如“星空”、“梦幻城堡”)与负面关键词(如“暗淡”、“单调”),引导AI算法创造出既符合正面引导又避免负面特征的图像。https://blog.csdn.net/2402_86680664/article/details/141033511?csdn_share_tail=%7B%22type%22%3A%22blog%22%2C%22rType%22%3A%22article%22%2C%22rId%22%3A%22141033511%22%2C%22source%22%3A%222402_86680664%22%7D

四、成果展示

        嘿嘿,终于到了我最喜欢的这一块地方了,夹带了点私货,大家别介意奥☆*:.。.o(≧▽≦)o.。.:*☆虽然说不够完美,但是已经非常好了,测试过n次的我十分满足ヽ(*・ω・)ノ

        话不多说,上图!!!

第一版:

第二版:

五、在使用中的注意事项

        没使用阿里云实例的人,图片保存之后一定要把结果上传魔塔!!!

        我就是因为第一次使用完了之后因为太激动了,想着说把图片保存了发文章记录一下自己的成果从而忘记去魔塔上传自己的结果了(当时整个人都崩溃了

        望大家引以为戒 (╥╯θ╰╥)(孩子真的碎掉了

六、总结(经典碎碎念

        因为是第一次接触AIGC,第一次就是从生成AI生成图片的方式让我非常感兴趣(´ ∀ ` *)

        我没有使用阿里云创建实例的方式,加上不小心退出了,导致我第一次制作的精美图片就没有上传打卡,所以就有了所谓的第二版,创建实例的时候还老是报错 (╯︵╰,)(我明明和之前一摸一样的操作啊

        总体上是给了我极好的体验。我个人对着方面也有着浓厚的兴趣,有点期待后面的内容了

        感谢各位的观看,如果对AIGC还有兴趣的话,我们下期见!

        完结撒花 ヾ(*´∀ ˋ*)ノ


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值