【Midjourney V6.1】细节之王,它来啦!

本周二,Midjourney正式发布了Midjourney Model V6.1图像模型(以下简称:V6.1),本次的更新是否足以让Midjourney再一次惊艳全球并继续站稳行业标杆呢?让我们一起来看看。

4543f2f66ef874beb4a15a5eb219642a.png

总的来说,就是:图像更加连贯、质量大幅度提升、生成速度更快!

More coherent images

更连贯的图像

用户在生成复杂内容(如:手臂、腿、手、身体、植物、动物等)时,V6.1能更准确地捕捉和表现这些细节,使图片看起来更加自然和连贯。

  • 测试图-人物(手指)

3a6f883e7e779b233a5a8923f99f21a2.png

* Mongolian male musician playing a traditional instrument

1c8a9cff442129f9fdcb2bfef24ae47f.png

* The bride shows her wedding ring to everyone

我们以“演奏乐器”和“展示婚戒”这种复杂动作进行了多次测试,发现以前经常被吐槽的“六指琴魔”Bug,其出现的几率在V6.1中已经少了很多。

  • 测试图-动植物

48d8d591559377c0745a0d63c1b352d7.png

* A panda eating bamboo

9849161a5f9ceb0475cdd36476f290c4.png

* A Venus flytrap preparing to catch prey

V6.1还能够做出大熊猫吃竹子时“用力皱眉的微表情”,以及用水迹展示捕蝇草“张开口器”的动作。

Much better image quality

更高质量的图像

V6.1通过减少像素痕迹和增强纹理细节,使图片更加平滑和细腻。

  • 测试图-多人物

3267ec6c86d937df1a7ce787a7e497e1.png

* Realistic style, family portrait, super detailed

740d6814e37acdaa1bcdef14469c073a.png

经测试,不管是人物的细节(发丝,皱纹),甚至连服饰材质(毛线、亚麻)都可以清晰的展示

More precise, detailed,

and correct small image features

更精确、详细和正确的小图像特征

小图像特征如眼睛,远处的人物等,我们对此使用“毕业照”这个人数较多的场景进行了测试

  • 测试图-前后景多人物

bd30ed6f0ccbb6d61261728a906f826b.png

* University graduation photo with a background of scattered people taking pictures

除了主体的角色,就连背景中虚化的人物,也可以清楚地看到他们的表情变化。

New upscalers

新的图像放大工具

  • 测试图-人物细节

cb480a3670f99067784fc62833786a1b.png

* Portrait of an elderly person wearing traditional Mongolian attire, standing in the snowy field at night, gazing into the distance

在V6.1中我们使用New upscalers后发现,图片仍能保持非常棒的清晰度和纹理质量,并不会出现模糊或失真。这意味着即使在大型广告牌或高清屏幕上展示,V6.1生成的图片仍然保持高分辨率。

Improved text accuracy

更高的文本准确性

  • 测试图-指定“文本”

6e5950fc52ed74157b4a23821429f3bb.png

* At the roadside at night, a Chinese restaurant has its sign lit up, with "Welcome" written on the sign

6560338a817f8990cd5f63f43f7e97f1.png

* At the concert, fans are holding up signs that say "I love you"

V6.1在创建包含文本的艺术作品时,能够更准确地渲染“引号”内的文字,避免了字体错误或排版问题。文字生成准确性相较之前的版本还是提高了非常多的。

A new personalization model

新的个性化代码

V6.1版本引入了更加个性化的new personalization model(图像个性化生成选项),相较之前版本,它能够更好的根据用户的偏好创造出专属风格的作品。例如,如果你是一位插画师,可以使用特定的风格(如:迪士尼、皮克斯)来生成图片。

此外,用户还可以保存并重用个性化代码,以保持特定的风格或效果,确保每次生成的图像都具有一致性。

* Personalization个性化功能就可以视为一种 lora,它能对原本的模型进行微调,来生成风格更独特的图像。如果想要使用Personalization个性化功能,你需要满足两个条件:

  1. 用户首先要在「Rank Images」版块内,完成至少 200 组图像评级。在这个过程中,系统会记录下你的风格偏好,并以此为基础对原本的模型进行风格微调,你选择图像的过程就等于是在训练 lora 模型。这一步必须先完成,否则无法调用 Personalization 功能。

  2. 上一步完成后,在提示词后加上 --p 参数发送出去后,生成的图像就会显示出你的专属风格,与默认模型会有明显不同,同时系统还会返回一个对应的个性化代码(举例:--personalize abc4def)。

* 个性化风格的强度也可以通过 --s 参数来调节,数值范围 0-1000,默认值 100,数值越高风格越明显。每个用户的个性化代码都不一样, 并且支持分享,使用他人的代码就相当于用他的专属风在生成图像。

这里我们引用一篇网络文章的配图进行举例:

3ddb182f5d3c15e7acd156048be44034.png

* 引用图片来源:https://www.uisdc.com/midjourney-personalization

结语

本次V6.1的更新确实做到了如发布提到的 Things should look “generally more beautiful” across the board

Midjourney称,预计会在下个月左右发布V6.2模型。为了进一步优化和改进,从今天起, V6.1已经成为了Midjourney所有用户的默认模型。

--- End ---

欢迎关注微软 智汇AI 官方账号
一手资讯抢先了解

喜欢就点击一下 在看 吧~
  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

叶锦鲤

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值