【Midjourney V6.1】细节之王，它来啦！

最新推荐文章于 2025-05-02 23:20:02 发布

叶锦鲤

最新推荐文章于 2025-05-02 23:20:02 发布

阅读量789

点赞数 5

文章标签： midjourney 人工智能

本文链接：https://blog.csdn.net/YeJuliaLi/article/details/140929662

版权

本周二，Midjourney正式发布了Midjourney Model V6.1图像模型（以下简称：V6.1），本次的更新是否足以让Midjourney再一次惊艳全球并继续站稳行业标杆呢？让我们一起来看看。

总的来说，就是：图像更加连贯、质量大幅度提升、生成速度更快！

More coherent images

更连贯的图像

用户在生成复杂内容（如：手臂、腿、手、身体、植物、动物等）时，V6.1能更准确地捕捉和表现这些细节，使图片看起来更加自然和连贯。

测试图-人物（手指）

* Mongolian male musician playing a traditional instrument

* The bride shows her wedding ring to everyone

我们以“演奏乐器”和“展示婚戒”这种复杂动作进行了多次测试，发现以前经常被吐槽的“六指琴魔”Bug，其出现的几率在V6.1中已经少了很多。

测试图-动植物

* A panda eating bamboo

* A Venus flytrap preparing to catch prey

V6.1还能够做出大熊猫吃竹子时“用力皱眉的微表情”，以及用水迹展示捕蝇草“张开口器”的动作。

Much better image quality

更高质量的图像

V6.1通过减少像素痕迹和增强纹理细节，使图片更加平滑和细腻。

测试图-多人物

* Realistic style, family portrait, super detailed

经测试，不管是人物的细节（发丝，皱纹），甚至连服饰材质（毛线、亚麻）都可以清晰的展示

More precise, detailed,

and correct small image features

更精确、详细和正确的小图像特征

小图像特征如眼睛，远处的人物等，我们对此使用“毕业照”这个人数较多的场景进行了测试

测试图-前后景多人物

* University graduation photo with a background of scattered people taking pictures

除了主体的角色，就连背景中虚化的人物，也可以清楚地看到他们的表情变化。

New upscalers

新的图像放大工具

测试图-人物细节

* Portrait of an elderly person wearing traditional Mongolian attire, standing in the snowy field at night, gazing into the distance

在V6.1中我们使用New upscalers后发现，图片仍能保持非常棒的清晰度和纹理质量，并不会出现模糊或失真。这意味着即使在大型广告牌或高清屏幕上展示，V6.1生成的图片仍然保持高分辨率。

Improved text accuracy

更高的文本准确性

测试图-指定“文本”

* At the roadside at night, a Chinese restaurant has its sign lit up, with "Welcome" written on the sign

* At the concert, fans are holding up signs that say "I love you"

V6.1在创建包含文本的艺术作品时，能够更准确地渲染“引号”内的文字，避免了字体错误或排版问题。文字生成准确性相较之前的版本还是提高了非常多的。

A new personalization model

新的个性化代码

V6.1版本引入了更加个性化的new personalization model（图像个性化生成选项），相较之前版本，它能够更好的根据用户的偏好创造出专属风格的作品。例如，如果你是一位插画师，可以使用特定的风格（如：迪士尼、皮克斯）来生成图片。

此外，用户还可以保存并重用个性化代码，以保持特定的风格或效果，确保每次生成的图像都具有一致性。

* Personalization个性化功能就可以视为一种 lora，它能对原本的模型进行微调，来生成风格更独特的图像。如果想要使用Personalization个性化功能，你需要满足两个条件：

用户首先要在「Rank Images」版块内，完成至少 200 组图像评级。在这个过程中，系统会记录下你的风格偏好，并以此为基础对原本的模型进行风格微调，你选择图像的过程就等于是在训练 lora 模型。这一步必须先完成，否则无法调用 Personalization 功能。
上一步完成后，在提示词后加上 --p 参数发送出去后，生成的图像就会显示出你的专属风格，与默认模型会有明显不同，同时系统还会返回一个对应的个性化代码（举例：--personalize abc4def）。

* 个性化风格的强度也可以通过 --s 参数来调节，数值范围 0-1000，默认值 100，数值越高风格越明显。每个用户的个性化代码都不一样，并且支持分享，使用他人的代码就相当于用他的专属风在生成图像。

这里我们引用一篇网络文章的配图进行举例：

* 引用图片来源：https://www.uisdc.com/midjourney-personalization

结语

本次V6.1的更新确实做到了如发布提到的 Things should look “generally more beautiful” across the board。

Midjourney称，预计会在下个月左右发布V6.2模型。为了进一步优化和改进，从今天起， V6.1已经成为了Midjourney所有用户的默认模型。

--- End ---

欢迎关注微软 智汇AI 官方账号
一手资讯抢先了解

喜欢就点击一下 在看 吧~