本部分主要分享AI绘画生成的工具&大模型介绍,由于是基础软件介绍,所以不会涉及过多深入的理论。
完整版的AIGC资料我已经打包好,需要的点击下方二维码,即可前往免费领取!

DALL·E 3
DALL·E 3是一款由OpenAI开发的图像生成模型,它通过深度学习技术将自然语言描述转换为图像。
DALL·E 3为创意产业、科研和教育等多个领域带来了生命力。
原理涉及文本理解、图像生成、优化与反馈等多个步骤,使用了transformer架构和多种图像合成技术。
相较于MJ等其他AI绘画工具,他可以听懂大白话,帮助用户实现脑中的想法。
DALL E3模板
- 背景: 舞池,昏暗灯光,人潮拥护, 大家都在享受音乐,摇摆身体``- 主角: 一个 20 岁的日本女性,正在人群中间跳舞``- 脸部: 闭着双眼,神情陶醉,沉浸在音乐中, 嘴角微微上扬``- 发型: 一头黑色长发垂落,露出一侧的耳朵``- 服装: 穿着黑色夏天便装, 清凉动感``- 姿势: 身体随着音乐扭动, 照片中的她身材刚好形成了一个S 型曲线
用DALL E3生成四格漫画。
1. 一个头发灰白, 但精致梳理的老头, 在河边钓鱼``2. 一个双马尾的小女孩, 在老人旁边默默地盯着水面``3. 老人抬杆, 中了一尾红色鲤鱼``4. 一个小女孩在老人旁边开心地蹦跳, 庆祝钓上了鱼`` ``使用 Monochrome Storyboard style,结合上述描述拆分的画面,每个场景矩阵式排列,画面旁边有描述场景的注释
DALL·E 3的应用领域广泛,包括创意产业、教育与研究、媒体与娱乐以及广告与市场营销等。
Midjourney
Midjourney是一个独立的研究实验室,专注于探索新的思维媒介,并扩展人类想象力。它由一个小而自给自足的团队组成,专注于设计、人类基础设施和AI。
MJ 就是一个人工智能绘图平台。它于2022年7月12日首次进行公测,并于2022年3月14日正式以架设在 Discord 上的服务器形式推出,用户直接注册 Discord 并加入 MJ 的服务器即可开始 AI 创作。
MJ在discord的社区
midjourney网页版上线,新用户目前拥有25次免费图像生成权益,在免费额度使用完后,须开通订阅会员才可以继续使用。
VHS still from the Iron Sky film directed by Adamski from 1979. Scene of a German Haunebu UFO flying saucer flying on the moon. Cassette futurism. Mars in the background. Shot on Kodak Gold film stock. --ar 4:3 --stylize 750 --v 6.1
a beauty
Midjourney利用深度学习技术和生成对抗网络(GAN),能够根据用户提供的文字描述或草图,自动生成符合要求的视觉图像。
它的应用场景广泛,包括设计工作辅助、艺术创作、教育与培训等。
Stable Diffusion
Stable Diffusion是一种潜在扩散模型(Latent Diffusion Model),能够从文本描述中生成图像。
可以用于图像修复、图像绘制、文本到图像和图像到图像等任务。
我们只要给出想要的图片的文字描述,在Stable Diffusion就能生成符合你要求的逼真的图像!
Stable Diffusion WebUI
Stable Diffusion WebUI是一个用户界面,常常是为了简化Stable Diffusion模型的使用而设计的。
允许用户通过一个更友好、可视化的网页界面来与Stable Diffusion模型互动,而不需要直接操作底层代码或终端命令。
界面让那些没有深度学习或编程经验的用户也能够轻松生成图像。
使用 秋葉大佬 的整合包进行安装
Stable Diffusion模型适合需要图像创作的领域,如设计、演示或创意构思。
Stable Diffusion ComfyUI
ComfyUI是一个为Stable Diffusion设计的图形用户界面和后端系统,它提供了一个模块化和功能强大的平台,使用户能够通过节点构建复杂的图像生成工作流程。
ComfyUI支持一键加载工作流,加快图像生成速度,并提供丰富的自定义选项。
适合数字艺术家、设计师、摄影师、AI研究人员和开发者、视频制作者、博客作者、社交媒体影响者、教育工作者、游戏和动画制作人员以及产品设计师。
目前可以在liblib AI可以在线使用comfyui。
有很多的开放的工作流,能不能使用就难说…
FLUX
FLUX是由Black Forest Labs推出的一款最新的文本生成图像模型。
FLUX模型全名为FLUX.1
,包含三个版本:FLUX.1 [pro]、FLUX.1 [dev]和FLUX.1 [schnell],分别针对不同的使用场景和需求。
FLUX.1 [pro]是闭源模型,提供最佳性能;FLUX.1 [dev]是开源模型,不可商用;FLUX.1 [schnell]是专为本地开发和个人使用量身定制的开源模型。
在线Demo:
-
https://replicate.com/black-forest-labs/flux-pro
-
https://replicate.com/black-forest-labs/flux-dev
-
https://replicate.com/black-forest-labs/flux-schnell
GitHub仓库:
- https://github.com/black-forest-labs/flux
HuggingFace模型库:
- https://huggingface.co/black-forest-labs/FLUX.1-schnell
Artistic interpretation of the human consciousness and subconsciousness
The world's largest black forest cake, the size of a building, surrounded by trees of the black forest
a tiny astronaut hatching from an egg on the moon
FLUX模型采用了创新的混合架构,融合了多模态处理能力和并行扩散机制的Transformer技术,并扩展至高达120亿个参数。