Midjourney基础教程入门

最新推荐文章于 2024-07-16 18:30:34 发布

IT学徒.

最新推荐文章于 2024-07-16 18:30:34 发布

阅读量514

点赞数

分类专栏： AIGC 文章标签： midjourney

本文链接：https://blog.csdn.net/superheromen/article/details/134953066

版权

AIGC 专栏收录该内容

5 篇文章

订阅专栏

本文介绍AIGC绘画创作，重点讲解Midjourney。先阐述AI绘画应用场景，如个性化设计、游戏娱乐等。接着介绍Midjourney注册、Discord使用及常用命令。还说明了其常用设置、参数，包括模型版本、纵横比、混乱度等，以及高级参数和多重提示词用法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

AIGC绘画创作与技巧

AI绘画的应用场景

个性化设计
- 设计一件独一无二的T恤
- 为自己的宠物生成一幅油画
- 生成更具针对性的广告图
游戏与娱乐
- AI绘画可以为游戏和动画片制作提供支持，生成更多样化、更有创意的角色和场景
教育
- AI绘画可以用于教育领域，帮助学习绘画的学生更好地理解和掌握绘画技巧，例如可以为不同的学生提供有针对性的指导，并实时反馈
时尚与服装设计
建筑与室内设计
影视后期制作
文化遗产保护与复原
- AI绘画可以辅助修复受损的艺术作品，如修补破损的画作、雕塑等

扩散模型的原理：

扩散模型的原理为：首先向图片添加噪声（正向扩散），让算法在此过程中学习图像的各种特征，然后，通过消除噪声（反向扩散）来训练算法恢复原始图片。这种方法与GAN的思路截然不同，它很快便在图像生成方面取得了优于GAN的效果，同时，在视频和音频生成等领域也展现出不俗的潜力。
在这里插入图片描述

DALL·E 2

OpenAI推出了具有突破性的深度学习算法CLIP（Contrastive Language-Image Pretraining，对比语言—图像预训练）。这一算法在人工智能领域产生了深远影响，对人工智能艺术的发展也带来了重大变革。CLIP将自然语言处理和计算机视觉相结合，能够有效地理解和分析文本与图像之间的关系，例如把“猫”这个词和猫的图像联系起来，这就为构建基于文本提示进行艺术创作的AI提供了可能。

Imagen

Midjourney介绍

举个例子，如果输入“一只蓝色的独角兽在星空下”，Midjourney可能会生成一张蓝色的独角兽站在山顶，周围环绕着五颜六色的星星和银河的图片。如果输入“蒸汽朋克风格的机器人”，它则可能创作出一幅金属质感的老式机器人画面，配以飞行物和烟囱等元素。

Midjourney完全运行在云端，没有专用客户端，用户需要通过Discord平台与Midjourney机器人进行交互。因此，运行Midjourney对设备硬件没有很高的要求，无论是计算机还是手机，只要可以访问Discord就能使用Midjourney。

注册账号

Midjourney目前还保持着Beta版的标记，要注册Midjourney账号，单击下图中首页右下角的“Join the Beta”按钮即可。如果已经有账号，可直接单击“Sign In”按钮登入。
在这里插入图片描述

Discord是由美国Discord公司开发的一款专为社群设计的免费网络实时通话软件与数字发行平台，如下图所示。如果之前没有用过，可以将它理解为一个能实时聊天的论坛，或者带主题分组功能的QQ群。

Discord使用介绍

进入Midjourney的服务器是如图下的界面
在这里插入图片描述

Discord的使用中有两个基本的概念：服务器、频道。服务器可以理解为一个大群，频道则是这个大群中以主题划分的讨论组，这也是Discord与QQ群或微信群不同的地方，不同的话题可以在不同的频道下面讨论，防止各种主题混在一起导致混乱。

加入Midjourney服务器后，可以去它的“NEWCOMER ROOMS”分组下的newbies-xxx频道（例如下图中的“newbies-112”频道，你看到的可能是其他编号）看一看，这里是专供新手熟悉Midjourney的地方，可以在其中看到很多其他人的发言以及绘画记录。用户也可以在这里了解Midjourney的绘图效果，或者尝试输入自己的绘图命令进行创作。
在这里插入图片描述

进入Discord的Midjourney服务器，可以看到它和其他聊天软件的界面很类似。可以在底部的聊天输入框中输入任意内容，并按Enter键发送，向频道或者聊天对象发送消息。更重要的是，可以在聊天输入框中发送命令，Midjourney机器人收到命令后会执行对应的操作。输入斜杠“/”，即可看到命令提示面板，如下图所示

在这里插入图片描述

可以在面板中单击选择要调用的命令，也可以继续在聊天对话框中手动输入完整的命令并按Enter键。例如输入“/info”命令并按Enter键，将看到如图所示的输出。
在这里插入图片描述

Midjourney常用的命令大全

/imagine prompt 用文本自动生成4张图像

/info 显示有关您的个人资料的信息

/invite 生成邀请链接并将其发送到你的个人消息界面，你可以发送邀请给某人，邀请其加入Midjourney

/ideas 给出一些随机的提示

/help 显示目前支持的机器人选项以方便你参考

/subscribe 获取订阅页面的链接

/fast 和 /relax 在“快速”和“松缓”模式之间切换。在快速模式下，如果您的信用额度不足，您的工作将按增量计费。在松缓模式下，您的工作不会花费积分，但需要更长的时间才能生成。

/private和/public 在“私人”和“公共”模式之间切换。在私人模式下，您的工作仅对您可见。在公共模式下，您的工作对画廊中的每个人都是可见的，即使您是在线程或个人消息界面中创建它们。如果想使用私人模式每月额外收费 20 美元。

/setting 打开偏好设置，里面可以预设一些命令

/blend 轻松地将多个图像混合在一起。

/show 输入/show在jobid 框里输入您的图库中所生成图像的作业ID 后，你可以再次召唤和恢复自己的任何生成图像

/prefer suffix 重置你的偏好设置(有时生成图片时会出现一些自己明明未添加的指令，却提示错误，可以执行一下这个命令)

/prefer remix 切换混音模式(可以让你在重生成或者变化图片时修改描述语)

/describe解析图片画面的内容，转换为提示词

/stealth 对于专业计划(60美元/月)的用户切换到隐身模式

/public 切换公共模式，在公共模式下，你生成的图像在画廊中对任何人都是可见的

/prefer option set 创建或管理自定义选项，

/prefer option list 查看当前自定义选项，

/help 显示有关Midjourney机器人相关的信息和提示

在私聊中发送命令

可以在Discord的Midjourney服务器上的公共频道中发送命令，Midjourney机器人会响应发送的命令。不过由于公共频道中通常有很多用户，发送的命令可能会很快被其他人的消息淹没，虽然机器人回应时会有提示，但有时仍需要在很多聊天记录中上下翻找，较为麻烦，因此，一般建议在正式绘画时和Midjourney机器人私聊。

私聊通常有两种方式，一种是频道的聊天记录中找到Midjourney机器人（名字叫“Midjourney Bot”），单击它的头像，直接给它发私信。只要发过一次私信，Midjourney机器人就会出现在私信列表中，如图所示。

在这里插入图片描述

可以在私聊中向它发送命令，这样消息就不会被其他人刷屏了。

第二种方式是自己创建一个服务器，将Midjourney机器人添加到这个服务器里，然后在这个服务器中向它发送命令。这种方式的好处是还可以添加其他人到服务器中，互相可以看到彼此的绘画结果，并随时交流。不过目前Midjourney没有团队版本，服务器中的各用户并不共享绘图额度，即每个想绘图的用户都需要单独付费。

需要注意的是，以上两种方式只是和Midjourney机器人可以单独聊天，但默认情况下所生成的图片仍然会在Midjourney网站上公开，任何人都可以看到。当然，同样也可以在Midjourney网站上看到其他人的作品。要想真正隐藏生成的图片，需要升级为专业版，具体见后面付费和订阅部分的介绍。

目前Midjourney的收费模式如下：

在这里插入图片描述

只有专业版用户可以选择隐藏生成的图片，对于免费试用版、基础版和标准版用户来说，在Midjourney平台生成的图片都是公开的，任何人都可以查看。简单来说，免费用户生成的图片不属于自己，使用时要注明来源（来自Midjourney），且不可商用；付费用户（包括基础版、标准版、专业版用户）生成的图片属于自己，可用作任何用途，包括商用。

生成的图片下方还有一些按钮，如下图所示。

在这里插入图片描述

这些按钮按功能可以分为三组，分别为U1～U4按钮，V1～V4按钮，以及一个刷新按钮。这三组按钮的含义如下。

U1～U4按钮：放大指定编号的小图。
V1～V4按钮：以指定编号的图为基础，做一些变化，生成四张新图。
刷新按钮：根据当前提示词重新生成四张新图。

如果对某张图比较满意，可以单击U1～U4中对应的按钮将它生成大图。如果觉得某张图已经比较接近想要的效果，但还想再微调一下看看，那么可以单击V1～V4中对应的按钮，以这张图为基础再生成四张图，需要注意的是，新图的变化是随机的，有可能变得更好，也有可能比旧图效果更差。

使用Midjourney绘画非常简单，只需像聊天一样在Discord中输入绘画命令以及提示词，Midjourney机器人便会在后台绘制图片并返回。对于每次绘图命令，Midjourney会返回四张候选图片，可以单击U1～U4按钮将最满意的那张放大，或者单击V1～V4按钮对指定图片再进行微调。

Midjourney的常用设置以及参数

设置

Midjourney将一些全局的常用设置集中在了设置面板中，要打开这个面板，只需在Discord的对话框中输入“/”，选择“/settings”命令并按Enter键，如图所示。

在这里插入图片描述

模型版本

在这里插入图片描述

Niji Model 5

擅长生成具有二次元动漫风格和美学特点的作品，它在动态／动作镜头以及以人物为中心的构图方面表现出色。

Public mode（公开模式）

Public mode模式表明生成的图片是否会公开显示，如果开启了此项，那么生成的图片会在Midjourney官网社区中公开，所有访问者都可以看见，也可以查看并学习其他用户公开的作品。需要注意的是，此项开启时，即使是Midjourney机器人私聊生成的图片，也会在Midjourney官网社区公开显示。目前，免费用户、基础版用户、标准版用户只能选择公开模式，只有专业版用户可以关闭此项，如果用户希望自己生成的图片不要被其他人看见，可以升级为专业版。

Fast mode（快速模式)

Fast mode模式表明当前是否在使用快速GPU时间，如果开启了此项，那么生成图片时将使用快速GPU时间，否则使用空闲GPU时间。顾名思义，快速模式下，生成图片会快一些，等待时间通常很少，Midjourney的计算资源会优先保证快速模式下的图片生成任务。空闲GPU时间也可以出图，只是速度没有保证，如果当前服务器闲置资源较多，可能出图速度也会很快，但如果闲置资源较少，可能要等待较长时间才能得到结果。目前免费用户、基础版用户不能使用空闲GPU时间，当账户中的计算配额用完就不能再生成图了。标准版用户和专业版用户则可以使用空闲GPU时间，即使当月计算配额用完仍然能使用空闲GPU时间出图。标准版用户和专业版用户，在用完当月快速模式的时间后，会自动切换为空闲GPU时间。

Remix mode（混合模式）

未开启混合模式时，输入提示词并生成图片后，单击图片下的变化按钮(V1、V2、V3、V4)时，对应的变化按钮会变成蓝色，同时直接生成四张新的微调后的图片。如果开启了混合模式，单击图片下方的变化按钮(V1、V2、V3、V4)时，对应的按钮会变成绿色，同时会弹出一个对话框，可以编辑提示词和参数，然后提交，生成四张新的图片，新图同时受老图以及编辑后的提示词影响，如下图所示。
在这里插入图片描述

提示词：line-art stack of pumpkins

在这里插入图片描述

输入新的混合提示词：pile of cartoon owls

在这里插入图片描述

Reset Settings（重置设置）

Reset Settings功能就是字面意思，单击这个按钮，可让Midjourney恢复初始的默认设置。

常用参数

在生成图片时，除了提示词，还有很多可选参数。通过这些参数，可以指定图像的宽高比、指定模型版本、更改图片风格等。如图4-26所示，参数一般添加到提示词的末尾，多个参数之间使用空格分隔。一些系统可能会自动将两个连续的连字符(–)替换为破折号(—)，不用担心，Midjourney两种符号都可识别。

在这里插入图片描述

图4-27所示是一个具体的添加参数的例子。前面已经介绍过指定模型版本的参数，如“–v 4”“–v 5”，接下来将继续介绍其他常用参数。

在这里插入图片描述

Aspect Ratios（纵横比）

纵横比是如1:2、2:3这样的表达式，前后两个数字分别代表图片的宽和高的比例。如果不指定，则默认为1:1，即生成正方形的图像。Midjourney各模型版本所支持的横纵比范围有所不同，v 4版本的横纵比范围为1:2～2:1，而Niji 5模型及Midjourney 5及之后的版本取消了对横纵比的限制，值可以是任意整数。横纵比会影响生成图像的形状和内容结构。在使用图片放大功能(Upscale)时，部分横纵比可能会稍有变动。

参数格式：aspect <宽：高>（或简写为：ar <宽:高>）

用法示例：vibrant california poppies --ar 5:4

常见纵横比

1:1默认纵横比，方形。
5:4常见的框架和打印比例。
3:2常见于印刷摄影。
7:4常见于高清电视屏幕或智能手机屏幕。

Chaos（混乱度）

Chaos参数决定生成图片的变化程度。数值越高，生成图片的风格和构图差异就越大，可能产生意想不到的组合结果；数值越低，风格和构图上的差别就越小，生成的图片之间具有更多相似性。

参数格式：–chaos <值>（或简写为–c <值>）
数值范围为0～100（默认值为0）。
用法示例：watermelon owl hybrid --c 50

低chaos值

在这里插入图片描述

高chaos值

在这里插入图片描述

非常高的chaos值
在这里插入图片描述

No（排除)

有时候，用户可能会希望生成的图片中不要出现指定的元素，这时就可以用“–no”参数。

参数格式：–no <某物>

Quality（生成图片质量）

在提示词后加上“–quality”或“–q”参数，可以更改生成图像的质量，更高质量的图像相应的也会包含更多的细节，同时需要更长的时间来处理，即会使用更多的GPU时长。当然，质量设置不影响图片的分辨率。

参数格式：–quality <0.25, 0.5, 1>（或简写为–q <0.25, 0.5, 1>）

在这里插入图片描述

Seed（种子值）

生成图片时可以注意到，在输入提示词后，生成的图像最初非常模糊，随后逐步变得清晰，这是因为Midjourney机器人利用种子值创建视觉噪声场（类似于电视无信号时的雪花点画面）作为生成初始图像网格的起始点，然后再逐步生成图像。Seed是Midjourney图像生成的初始点，默认情况下每次绘画的种子值是随机生成的，如果指定Seed参数的值，那么在相同的种子值和提示词下会产生相似或者几乎相同的画面，利用这点就可以生成连贯一致的人物形象或者场景。

参数格式：–seed<数值>

数值范围：0～4294967295

在模型版本v 1、v 2、v 3中使用相同“–seed”值将生成具有相似构图、颜色和细节的图像。在模型版本v 4、v 5、v 5.1和Niji中使用相同“–seed”值将产生几乎相同的图像。来看一组例子。使用同一提示词“celadon owl pitcher”以及随机种子运行3次，结果如图所示。

在这里插入图片描述

而当加上“–seed 123”参数运行两次作业，结果是一样的，如图所示。

在这里插入图片描述

第一次生成

在这里插入图片描述

当生成了一组优秀的图片，想要记录下Seed值以便分享或将来再次生成时，是否有办法知道具体的Seed值呢？只需按照以下步骤操作，便可获取指定图像生成过程中的Seed值。首先，生成连续的四张图像之后，单击图像右上角的笑脸符号（如图1所示），在弹出的窗口内搜索“envelope”，并单击第一个信封图标（如图2所示）

在这里插入图片描述

接下来，Midjourney机器人会向你发送一条私信。打开私信，即可看到本次生成所使用的Seed值，如图所示。

在这里插入图片描述

复制Seed值（一串数字）作为下次指令中的“–seed”参数，即可获得相同的图像结果。

Stop（停止渲染）

Stop参数可以让图像在渲染过程中止在某一步，直接出图。如果不做任何stop参数设置，得到的图像是完成整个渲染过程的，比较清晰的。渲染过程的生成步数为100，以此类推，生成的步数越少，停止渲染的时间就越早，生成的图像也就越模糊。

参数格式：–stop <数值>

其中数值的范围为1～100，例如使用提示词“splatter art painting of acorns --stop 90”，图片将在90%进度时停止渲染。

Stylize（风格化）

Stylize的值表示生成图片的创造力、艺术色彩表现力、构图以及风格，数值越大，赋予AI的发挥空间越广泛。

参数格式：–stylize<数值>（或简写为–s<数值>）
数值范围：1～1000
默认数值：100

不同的Midjourney模型版本支持的风格化范围不同，在v 4、v 5、v 5.1以及Niji 5中默认值为100，数值范围为0～1000。Stylize有两种使用方式，可以在提示词末尾添加“–stylize”参数，也可以输入“/settings”命令并从菜单中选择自己相应的风格化值，如图所示。

在这里插入图片描述

高级参数及命令

提示图片（垫图）

提示图片也叫垫图，可以在提示词最前面传入一张或多张图片的链接地址，这些传入的图片即为提示图片，它们将影响生成图片的构图、风格和颜色等特征。具体用法如图所示。

在这里插入图片描述

如果传入了两张以上的提示图片，那么可以省略提示文本以及参数，其效果相当于融合(Blend)。

示例

来看一个具体的例子，如图所示包含五张不同的图片，我们来尝试将不同的图片做一些组合。

在这里插入图片描述

V 4版本演示效果如图所示。

在这里插入图片描述

V 5版本演示效果，如图所示。

使用提示图片时，需要注意宽高比，提示图片与最终生成图片的宽高比相同时效果最佳，否则可能会出现边框。

在这里插入图片描述

图片权重参数

使用提示图片时，可以用参数“–iw”来调整提示图片的权重。未指定“–iw”参数时，默认值为1。较高的–iw值意味着提示图片将对生成的新图片产生较大的影响。不同的Midjourney模型版本具有不同的图片权重范围。

参数格式：iw <数值>

数值范围：0-2（v 5和Niji5版，v 4版不可用）

提示词示例：flowers.jpg birthday cake --iw 0.5

融合(Blend)

融合命令(/blend)可将多张图片融合为一张新图，功能与“/imagine”命令中使用多张提示图的效果相同，但无须添加提示文本或参数。它的界面经过优化，操作直观简便，无论在移动设备还是桌面设备上都能方便地使用。

“/blend”命令最多可处理5张图像，如果想融合更多图片，请在“/imagine”命令中使用提示图片。看一个例子，将一张陶瓷花瓶的图片和一张牡丹的图片融合，如图1～图3所示。

在这里插入图片描述

按Enter键确认融合后，将生成四张新图，如图4-81所示。从生成的图片中可以看到，其中三张图片中牡丹花成为陶瓷花瓶的图案，而另一张则将牡丹花作为图片背景。

在这里插入图片描述

多重提示词(Multi Prompts)

Midjourney的提示词中可以使用::（双冒号）作为分隔符，将关键词分隔为两个或多个不同的概念。同时，还可以用分隔符调整提示词各个部分的重要程度。在一些情况下，这个功能非常有用。

基本用法

多重提示词适用于模型版本v1、v2、v3、v4、v5、v5.1、niji 4和niji 5，其他参数仍然添加到提示词的最后。来看一个例子，如果生成图像时使用了提示词“hot dog”，Midjourney会将它看作一个整体，并生成美味的热狗图像，如图1所示。但如果使用双冒号将提示词分成两部分，例如“hot:: dog”，那么“hot”和“dog”两个概念将被分开处理，生成很热的狗的图片，如图2所示。

在这里插入图片描述

权重

使用双冒号“::”将提示词分成不同的部分时，还可以在双冒号后添加一个数字，调整对应关键词的权重。例如刚才的示例中，用提示词“hot:: dog”生成了一只火热的狗。如果把它改为“hot::2 dog”，那么hot这个词的重要性将是dog的2倍，会生成非常热的狗的图，如图4-87所示。在v 1、v 2、v 3版模型中，权重值只接受整数参数，v 4版模型开始可以接受小数形式的权重值。如果“::”后没有添加数字，则使用1作为默认值。

在这里插入图片描述

提示词中的权重是一个相对比较的概念，例如“hot:: dog”和“hot::100dog::100”是等价的，更多参数如表所示

在这里插入图片描述

负数权重

权重数值可以为负数，用于移除不需要的元素，但所有权重的总和必须是正数。看一个例子，使用“vibrant tulip fields”提示词生成了郁金香花田的图片，如图1所示，然后，又使用“red::-.5”参数移除了图片中的红色，如图2所示。

提示词：vibrant tulip fields

提示词：vibrant tulip fields:: red::-.5

在这里插入图片描述

负数权重也是相对比较的，即表达方式“tulips:: red::-.5”与“tulips::2 red::-1”“tulips::200 red::-100”都是等价的。
素，但所有权重的总和必须是正数。看一个例子，使用“vibrant tulip fields”提示词生成了郁金香花田的图片，如图1所示，然后，又使用“red::-.5”参数移除了图片中的红色，如图2所示。