释放您内心的艺术家:使用稳定的 Diffusion WebUI 免费创建令人惊叹的图像 - 无需编码技能!
掌握图像生成的艺术:使用 AI 驱动的稳定扩散 WebUI 免费生成迷人图像的分步指南 - 无需编码!
生成式人工智能
生成式人工智能是一种创新技术,它使计算机能够创建原创内容,例如图像、音乐甚至文本。它涉及对大量数据进行机器学习模型训练,使它们能够理解模式并生成类似于输入数据的新输出。通过利用生成式人工智能的力量,我们可以释放无限的创意可能性,让计算机能够制作曾经仅属于人类创造力领域的独特而迷人的内容。
生成式人工智能已在各个领域得到应用,展现了其多功能性和创造潜力。以下是一些示例:
- 图像生成:生成对抗网络 (GAN) 可以生成前所未有的逼真图像。例如,NVIDIA 的 StyleGAN 已用于创建极其逼真的人脸。来源:NVIDIA AI Playground
- 音乐创作:OpenAI 的 MuseNet 等深度学习模型已在大量音乐数据集上进行训练,使它们能够创作不同流派和风格的原创作品。资料来源:OpenAI 博客
- 文本生成:GPT-3 等语言模型可以生成连贯且上下文相关的文本。它们已被用来生成新闻文章、故事,甚至协助内容创作。资料来源:OpenAI Playground
- 艺术风格转换:风格转换算法,例如 DeepArt 的 NeuralStyle,可以将普通图像转换为受著名艺术家启发的视觉震撼艺术作品。资料来源:DeepArt.io
- 视频合成:NVIDIA 的 vid2vid 等生成模型可以从简单的草图或语义标签生成逼真的视频,从而轻松实现视频编辑和内容创建。资料来源:NVIDIA AI Research
这些例子说明了生成式人工智能如何彻底改变各个创意领域,为艺术家、音乐家、作家和内容创作者带来新的可能性。
文本转图像
使用文本生成图像的生成式人工智能为品牌和公司提供了巨大的潜力。通过利用这项技术,企业可以简化其创意流程并增强其视觉内容制作。
例如,通过简单的文字描述或一组关键词,生成式人工智能可以自动生成符合品牌身份或产品特色的高质量图像。如果操作得当,这不仅可以节省时间和资源,还可以确保不同平台上的视觉品牌形象保持一致。
此外,生成式人工智能使公司能够快速制作原型并迭代视觉设计,从而高效探索各种创意方向。最终,在图像生成中利用生成式人工智能可以帮助品牌和公司加速内容创作,保持视觉凝聚力,并为受众提供引人入胜的视觉体验。
虽然生成式人工智能在使用文本生成图像方面具有优势,但也有一些反驳意见需要考虑:
- 缺乏真实性:生成的图像可能缺乏真实性和人情味,无法引起观众的共鸣。这可能会导致情感联系和品牌信誉的丧失。
- 有限的创意控制:仅依靠生成式人工智能来生成图像可能会限制表达独特品牌特征和创意愿景的能力。它可能无法捕捉到人类设计师可以提供的细微细节和微妙的信息。
- 品牌差异化:通用或公式化生成的图像可能无法有效区分品牌与其竞争对手。由人类设计师创建的定制视觉元素和精心策划的设计可以更好地反映品牌的个性并使其与众不同。
- 法律和道德问题:如果人工智能模型是在受版权保护的材料上进行训练的,那么使用生成式人工智能生成图像可能会引发版权或知识产权问题。此外,还需要解决有关数据使用和人工智能系统内潜在偏见的道德问题。
- 缺乏适应性:生成式 AI 模型可能难以适应特定的视觉要求或不断变化的市场趋势。人类设计师通常更善于理解文化差异、目标受众偏好和不断发展的设计趋势。
重要的是在利用生成式人工智能提高效率和创造力与融入人类设计师的专业知识和创造性见解以保持真实性和品牌独特性之间取得平衡。
让我们逐步了解如何利用生成式人工智能来满足您的业务需求。
脚步
- 根据您的操作系统,您必须安装以下程序:
a. Git —说明
b. Python —说明
c. Miniconda —说明
您当前的操作系统可能已经安装了 Git 和 Python。在这种情况下,请安装 miniconda 并创建一个新环境,然后在该环境中安装 git 和 python。
- 安装 miniconda 后,为稳定传播的 webui 创建一个新环境:
conda创建 --名称 stablediff-env python=3.9 git
环境创建完成后,使用以下命令激活它:
conda 激活 stablediff-env
- 现在,在您想要的目录下,创建一个新目录,然后从该目录启动一个新终端,或者从您的终端更改到此目录:
mkdir stablediffusion && cd stablediffusion
- 如果您熟悉 git,请使用以下命令;否则,请从此 git 存储库下载文件
git克隆https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
我的目录位置
这是稳定的 Diffusion 网页用户界面
4.克隆完成后,进入stable diff文件夹:
cd稳定扩散-webui
在这里面,你会看到一个“模型”目录:
在模型目录中,导航到该Stable-diffusion
目录。
- 现在打开浏览器并访问此网站https://civitai.com/并下载任何检查点模型。下载完成后,文件的扩展名应为
.safetensors
。
(选择模型时请注意文件大小,因为大型模型权重可能不适合您的小型系统内存)
6.将下载的扩展文件放在目录.safetensors
中Stable-diffusion
我在 Stable-diffusion 目录中有三个模型
- 现在回到你的终端,从稳定扩散 webui git 目录的根目录
光盘../../
输入以下命令来启动 Web UI:
/bin/bash webui.sh
启动 webui 需要一些时间,启动后它会给你本地 url:
我的本地网址
从你的浏览器访问它,你将看到稳定的传播 webui:
网页用户界面
- 从顶部的稳定扩散检查点,您可以从目录中的可用模型中更改模型
model/Stable-difussion
:
- 在输入部分输入提示,然后单击右侧的生成按钮。根据您在底部输入的参数,它将生成一张新图像,您可以保存它,现在它完全属于您了 )
提示示例
以下图像是使用我的系统上的稳定扩散 Web UI 生成的,该系统具有 Intel i7 处理器、8 GB RAM、Linux Mint OS 和 Nvidia 960M GPU。考虑到 RAM 大小,我必须分别将宽度和高度参数设置为 256 和 256 像素。在撰写本文时,我使用了 DreamShaper 的最新检查点。
提示:现实的展厅,大,灯光,人群,商业
提示:身穿金色套装的机器人肖像,D&D 科幻,艺术站,概念艺术,高度详细的插图
请注意,及时给出明确的细节如何改善最终的图像。
提示:开悟者的内心
提示:迈克·奥莱德和弗雷泽塔以及卡罗尔·巴克·夏普创作的《身穿盔甲的骑士骑在一匹强壮的战马上》。数字绘画。梦境潜空间。哑光绘画,概念艺术。艺术站。数字渲染。逼真,8 k
单词提示不会给你带来任何帮助。
提示:哥斯拉
而更详细的提示会给出更好的输出:
提示:海洋中的哥斯拉,巨大的生物,超现实,8K,真实
不仅仅能制作时髦的图像
一旦您弄清楚了提示,就可以探索各种其他参数,例如单击,take to extras
在该面板中,您可以下载适用于您生成的图像的模型,以使其更加高档,逼真等等。
在此窗格中,一旦选择了任何选项,模型就会自动出现。
附加窗格
例如在我的models/Lora
目录中,我有一个使图像更逼真(或对其进行微调)的模型:
洛拉
如果您对稳定扩散非常认真,那么您绝对应该阅读有关Lora和automatic1111的更多信息。
如果您是计算机科学方面的老手,那么最好启动一个带有 GPU 的云实例(没有 GPU 的实例也可以),让云完成所有繁重的工作。
完成工作后,您可以终止实例并仅支付使用期间的费用。
上述指令在Google Colab中不起作用,因为webui.sh
脚本会抛出 root 权限错误。
如果您在第一次使用图像生成后看到“禁用半点”之类的错误,则您的模型文件在第一次使用后已损坏。因此,请删除目录.safetensors
中的扩展模型文件。从下载目录中再次复制并粘贴它们,或从https://civitai.com/网站model/Stable-diffusion
再次下载模型。
tory/)中不起作用,因为webui.sh
脚本会抛出 root 权限错误。
如果您在第一次使用图像生成后看到“禁用半点”之类的错误,则您的模型文件在第一次使用后已损坏。因此,请删除目录.safetensors
中的扩展模型文件。从下载目录中再次复制并粘贴它们,或从https://civitai.com/网站model/Stable-diffusion
再次下载模型。
负责任地使用它并始终告知图像消费者该图像是使用 AI 生成的。
博客原文:https://dz.closeai.cc/thread-172-1-1.html