关于AI绘画的那些超好用工具盘点（附软件安装包）

本文链接：https://blog.csdn.net/2401_84830464/article/details/142378919

本部分主要分享AI绘画生成的工具&大模型介绍，由于是基础软件介绍，所以不会涉及过多深入的理论。

完整版的AIGC资料我已经打包好，需要的点击下方二维码，即可前往免费领取！

在这里插入图片描述

DALL·E 3

DALL·E 3是一款由OpenAI开发的图像生成模型，它通过深度学习技术将自然语言描述转换为图像。

DALL·E 3为创意产业、科研和教育等多个领域带来了生命力。

原理涉及文本理解、图像生成、优化与反馈等多个步骤，使用了transformer架构和多种图像合成技术。

相较于MJ等其他AI绘画工具，他可以听懂大白话，帮助用户实现脑中的想法。

DALL E3模板

- 背景: 舞池,昏暗灯光，人潮拥护, 大家都在享受音乐，摇摆身体``- 主角: 一个 20 岁的日本女性,正在人群中间跳舞``- 脸部: 闭着双眼,神情陶醉,沉浸在音乐中, 嘴角微微上扬``- 发型: 一头黑色长发垂落，露出一侧的耳朵``- 服装: 穿着黑色夏天便装, 清凉动感``- 姿势: 身体随着音乐扭动, 照片中的她身材刚好形成了一个S 型曲线

用DALL E3生成四格漫画。

1. 一个头发灰白, 但精致梳理的老头, 在河边钓鱼``2. 一个双马尾的小女孩, 在老人旁边默默地盯着水面``3. 老人抬杆, 中了一尾红色鲤鱼``4. 一个小女孩在老人旁边开心地蹦跳, 庆祝钓上了鱼``   ``使用 Monochrome Storyboard style，结合上述描述拆分的画面，每个场景矩阵式排列，画面旁边有描述场景的注释

DALL·E 3的应用领域广泛，包括创意产业、教育与研究、媒体与娱乐以及广告与市场营销等。

Midjourney

Midjourney是一个独立的研究实验室，专注于探索新的思维媒介，并扩展人类想象力。它由一个小而自给自足的团队组成，专注于设计、人类基础设施和AI。

MJ 就是一个人工智能绘图平台。它于2022年7月12日首次进行公测，并于2022年3月14日正式以架设在 Discord 上的服务器形式推出，用户直接注册 Discord 并加入 MJ 的服务器即可开始 AI 创作。

MJ在discord的社区

midjourney网页版上线，新用户目前拥有25次免费图像生成权益，在免费额度使用完后，须开通订阅会员才可以继续使用。

VHS still from the Iron Sky film directed by Adamski from 1979. Scene of a German Haunebu UFO flying saucer flying on the moon. Cassette futurism. Mars in the background. Shot on Kodak Gold film stock. --ar 4:3 --stylize 750 --v 6.1

a beauty

Midjourney利用深度学习技术和生成对抗网络(GAN)，能够根据用户提供的文字描述或草图，自动生成符合要求的视觉图像。

它的应用场景广泛，包括设计工作辅助、艺术创作、教育与培训等。

Stable Diffusion

Stable Diffusion是一种潜在扩散模型（Latent Diffusion Model），能够从文本描述中生成图像。

可以用于图像修复、图像绘制、文本到图像和图像到图像等任务。

我们只要给出想要的图片的文字描述，在Stable Diffusion就能生成符合你要求的逼真的图像！

Stable Diffusion WebUI

Stable Diffusion WebUI是一个用户界面，常常是为了简化Stable Diffusion模型的使用而设计的。

允许用户通过一个更友好、可视化的网页界面来与Stable Diffusion模型互动，而不需要直接操作底层代码或终端命令。

界面让那些没有深度学习或编程经验的用户也能够轻松生成图像。

使用秋葉大佬的整合包进行安装

Stable Diffusion模型适合需要图像创作的领域，如设计、演示或创意构思。

Stable Diffusion ComfyUI

ComfyUI是一个为Stable Diffusion设计的图形用户界面和后端系统，它提供了一个模块化和功能强大的平台，使用户能够通过节点构建复杂的图像生成工作流程。

ComfyUI支持一键加载工作流，加快图像生成速度，并提供丰富的自定义选项。

适合数字艺术家、设计师、摄影师、AI研究人员和开发者、视频制作者、博客作者、社交媒体影响者、教育工作者、游戏和动画制作人员以及产品设计师。

目前可以在liblib AI可以在线使用comfyui。

有很多的开放的工作流，能不能使用就难说…

FLUX

FLUX是由Black Forest Labs推出的一款最新的文本生成图像模型。

FLUX模型全名为FLUX.1，包含三个版本：FLUX.1 [pro]、FLUX.1 [dev]和FLUX.1 [schnell]，分别针对不同的使用场景和需求。

FLUX.1 [pro]是闭源模型，提供最佳性能；FLUX.1 [dev]是开源模型，不可商用；FLUX.1 [schnell]是专为本地开发和个人使用量身定制的开源模型。

在线Demo：

https://replicate.com/black-forest-labs/flux-pro
https://replicate.com/black-forest-labs/flux-dev
https://replicate.com/black-forest-labs/flux-schnell

GitHub仓库：

https://github.com/black-forest-labs/flux

HuggingFace模型库：

https://huggingface.co/black-forest-labs/FLUX.1-schnell

Artistic interpretation of the human consciousness and subconsciousness

The world's largest black forest cake, the size of a building, surrounded by trees of the black forest

a tiny astronaut hatching from an egg on the moon

FLUX模型采用了创新的混合架构，融合了多模态处理能力和并行扩散机制的Transformer技术，并扩展至高达120亿个参数。