本周二,Midjourney正式发布了Midjourney Model V6.1图像模型(以下简称:V6.1),本次的更新是否足以让Midjourney再一次惊艳全球并继续站稳行业标杆呢?让我们一起来看看。
总的来说,就是:图像更加连贯、质量大幅度提升、生成速度更快!
More coherent images
更连贯的图像
用户在生成复杂内容(如:手臂、腿、手、身体、植物、动物等)时,V6.1能更准确地捕捉和表现这些细节,使图片看起来更加自然和连贯。
- 测试图-人物(手指)
* Mongolian male musician playing a traditional instrument
* The bride shows her wedding ring to everyone
我们以“演奏乐器”和“展示婚戒”这种复杂动作进行了多次测试,发现以前经常被吐槽的“六指琴魔”Bug,其出现的几率在V6.1中已经少了很多。
- 测试图-动植物
* A panda eating bamboo
* A Venus flytrap preparing to catch prey
V6.1还能够做出大熊猫吃竹子时“用力皱眉的微表情”,以及用水迹展示捕蝇草“张开口器”的动作。
Much better image quality
更高质量的图像
V6.1通过减少像素痕迹和增强纹理细节,使图片更加平滑和细腻。
- 测试图-多人物
* Realistic style, family portrait, super detailed
经测试,不管是人物的细节(发丝,皱纹),甚至连服饰材质(毛线、亚麻)都可以清晰的展示
More precise, detailed,
and correct small image features
更精确、详细和正确的小图像特征
小图像特征如眼睛,远处的人物等,我们对此使用“毕业照”这个人数较多的场景进行了测试
- 测试图-前后景多人物
* University graduation photo with a background of scattered people taking pictures
除了主体的角色,就连背景中虚化的人物,也可以清楚地看到他们的表情变化。
New upscalers
新的图像放大工具
- 测试图-人物细节
* Portrait of an elderly person wearing traditional Mongolian attire, standing in the snowy field at night, gazing into the distance
在V6.1中我们使用New upscalers后发现,图片仍能保持非常棒的清晰度和纹理质量,并不会出现模糊或失真。这意味着即使在大型广告牌或高清屏幕上展示,V6.1生成的图片仍然保持高分辨率。
Improved text accuracy
更高的文本准确性
- 测试图-指定“文本”
* At the roadside at night, a Chinese restaurant has its sign lit up, with "Welcome" written on the sign
* At the concert, fans are holding up signs that say "I love you"
V6.1在创建包含文本的艺术作品时,能够更准确地渲染“引号”内的文字,避免了字体错误或排版问题。文字生成准确性相较之前的版本还是提高了非常多的。
A new personalization model
新的个性化代码
V6.1版本引入了更加个性化的new personalization model(图像个性化生成选项),相较之前版本,它能够更好的根据用户的偏好创造出专属风格的作品。例如,如果你是一位插画师,可以使用特定的风格(如:迪士尼、皮克斯)来生成图片。
此外,用户还可以保存并重用个性化代码,以保持特定的风格或效果,确保每次生成的图像都具有一致性。
* Personalization个性化功能就可以视为一种 lora,它能对原本的模型进行微调,来生成风格更独特的图像。如果想要使用Personalization个性化功能,你需要满足两个条件:
- 用户首先要在「Rank Images」版块内,完成至少 200 组图像评级。在这个过程中,系统会记录下你的风格偏好,并以此为基础对原本的模型进行风格微调,你选择图像的过程就等于是在训练 lora 模型。这一步必须先完成,否则无法调用 Personalization 功能。
- 上一步完成后,在提示词后加上 --p 参数发送出去后,生成的图像就会显示出你的专属风格,与默认模型会有明显不同,同时系统还会返回一个对应的个性化代码(举例:--personalize abc4def)。
* 个性化风格的强度也可以通过 --s 参数来调节,数值范围 0-1000,默认值 100,数值越高风格越明显。每个用户的个性化代码都不一样, 并且支持分享,使用他人的代码就相当于用他的专属风在生成图像。
这里我们引用一篇网络文章的配图进行举例:
* 引用图片来源: https://www.uisdc.com/midjourney-personalization
结语
本次V6.1的更新确实做到了如发布提到的 Things should look “generally more beautiful” across the board。
Midjourney称,预计会在下个月左右发布V6.2模型。为了进一步优化和改进,从今天起, V6.1已经成为了Midjourney所有用户的默认模型。