本周二,Midjourney正式发布了Midjourney Model V6.1图像模型(以下简称:V6.1),本次的更新是否足以让Midjourney再一次惊艳全球并继续站稳行业标杆呢?让我们一起来看看。

【Midjourney V6.1】细节之王,它来啦!_midjourney

总的来说,就是:图像更加连贯、质量大幅度提升、生成速度更快!

More coherent images

更连贯的图像

用户在生成复杂内容(如:手臂、腿、手、身体、植物、动物等)时,V6.1能更准确地捕捉和表现这些细节,使图片看起来更加自然和连贯。

  • 测试图-人物(手指)

【Midjourney V6.1】细节之王,它来啦!_bc_02

* Mongolian male musician playing a traditional instrument

【Midjourney V6.1】细节之王,它来啦!_ide_03

* The bride shows her wedding ring to everyone

我们以“演奏乐器”和“展示婚戒”这种复杂动作进行了多次测试,发现以前经常被吐槽的“六指琴魔”Bug,其出现的几率在V6.1中已经少了很多。

  • 测试图-动植物

【Midjourney V6.1】细节之王,它来啦!_图像特征_04

* A panda eating bamboo

【Midjourney V6.1】细节之王,它来啦!_ide_05

* A Venus flytrap preparing to catch prey

V6.1还能够做出大熊猫吃竹子时“用力皱眉的微表情”,以及用水迹展示捕蝇草“张开口器”的动作。

Much better image quality

更高质量的图像

V6.1通过减少像素痕迹和增强纹理细节,使图片更加平滑和细腻。

  • 测试图-多人物

【Midjourney V6.1】细节之王,它来啦!_图像特征_06

* Realistic style, family portrait, super detailed

【Midjourney V6.1】细节之王,它来啦!_midjourney_07

经测试,不管是人物的细节(发丝,皱纹),甚至连服饰材质(毛线、亚麻)都可以清晰的展示

More precise, detailed,

and correct small image features

更精确、详细和正确的小图像特征

小图像特征如眼睛,远处的人物等,我们对此使用“毕业照”这个人数较多的场景进行了测试

  • 测试图-前后景多人物

【Midjourney V6.1】细节之王,它来啦!_midjourney_08

* University graduation photo with a background of scattered people taking pictures

除了主体的角色,就连背景中虚化的人物,也可以清楚地看到他们的表情变化。

New upscalers

新的图像放大工具

  • 测试图-人物细节

【Midjourney V6.1】细节之王,它来啦!_人工智能_09

* Portrait of an elderly person wearing traditional Mongolian attire, standing in the snowy field at night, gazing into the distance

在V6.1中我们使用New upscalers后发现,图片仍能保持非常棒的清晰度和纹理质量,并不会出现模糊或失真。这意味着即使在大型广告牌或高清屏幕上展示,V6.1生成的图片仍然保持高分辨率。

Improved text accuracy

更高的文本准确性

  • 测试图-指定“文本”

【Midjourney V6.1】细节之王,它来啦!_ide_10

* At the roadside at night, a Chinese restaurant has its sign lit up, with "Welcome" written on the sign

【Midjourney V6.1】细节之王,它来啦!_图像特征_11

* At the concert, fans are holding up signs that say "I love you"

V6.1在创建包含文本的艺术作品时,能够更准确地渲染“引号”内的文字,避免了字体错误或排版问题。文字生成准确性相较之前的版本还是提高了非常多的。

A new personalization model

新的个性化代码

V6.1版本引入了更加个性化的new personalization model(图像个性化生成选项),相较之前版本,它能够更好的根据用户的偏好创造出专属风格的作品。例如,如果你是一位插画师,可以使用特定的风格(如:迪士尼、皮克斯)来生成图片。

此外,用户还可以保存并重用个性化代码,以保持特定的风格或效果,确保每次生成的图像都具有一致性。

* Personalization个性化功能就可以视为一种 lora,它能对原本的模型进行微调,来生成风格更独特的图像。如果想要使用Personalization个性化功能,你需要满足两个条件:

  1. 用户首先要在「Rank Images」版块内,完成至少 200 组图像评级。在这个过程中,系统会记录下你的风格偏好,并以此为基础对原本的模型进行风格微调,你选择图像的过程就等于是在训练 lora 模型。这一步必须先完成,否则无法调用 Personalization 功能。
  2. 上一步完成后,在提示词后加上 --p 参数发送出去后,生成的图像就会显示出你的专属风格,与默认模型会有明显不同,同时系统还会返回一个对应的个性化代码(举例:--personalize abc4def)。

* 个性化风格的强度也可以通过 --s 参数来调节,数值范围 0-1000,默认值 100,数值越高风格越明显。每个用户的个性化代码都不一样, 并且支持分享,使用他人的代码就相当于用他的专属风在生成图像。

这里我们引用一篇网络文章的配图进行举例:

【Midjourney V6.1】细节之王,它来啦!_图像特征_12

* 引用图片来源: https://www.uisdc.com/midjourney-personalization

结语

本次V6.1的更新确实做到了如发布提到的 Things should look “generally more beautiful” across the board

Midjourney称,预计会在下个月左右发布V6.2模型。为了进一步优化和改进,从今天起, V6.1已经成为了Midjourney所有用户的默认模型。

--- End ---
  • 1.