AI绘画|“Midjourney V6革新:AI艺术创作的新高度?”

Midjourney在Discord上宣布了最新版本V6的测试版发布。经过9个月的训练,尽管没有明确的比较基准,但根据用户测试所展示的能力来看,可以说它是目前最先进的文本到图像模型。

让我们总结一下这个版本与之前版本V5相比的关键升级:

1. 改进的图像放大器,将分辨率提高一倍。 2. 更准确的提示跟随和更长的提示,支持300个字符以上。 3. 提升的连贯性和模型知识,更好地理解您描述的语义含义。 4. 改进的图像提示和混合。 5. 提高的文本绘制能力,支持图像文本生成。

简而言之,V6具有更强的语义理解和图像生成能力,可以容纳更多文字,实现更个性化的图像设计,并且分辨率提高一倍。

就图像质量而言,Midjourney V6相较于之前的版本有了飞跃。以下是V5和V6图像的比较,可以看到V6生成的图像具有出色的质感、光照和结构真实感。

I. 与V5.2相比,V6的图像更加丰富和逼真。

V6在图像生成能力方面的改进显著。与V5.2相比,V6的图像更加丰富和逼真。V5.2在细节方面已经能够产生“逼真”的结果,但V6则更加“真实”而非“模拟”。如果提示准确,结果甚至具有类似相机拍摄的真实质感。

例如,当比较两碗牛肉土豆炖菜时,V6生成的版本无疑更具食欲。

一锅带有木勺的炖菜,自上而下的视角。

现在,让我们来看一组描绘侏罗纪时代的图像,人类在科幻背景下赶走一只暴龙。细节丰富,逼真感十足。

电影般的画面,一只暴龙被一架阿帕奇直升机袭击,森林起火,背景中爆炸着。

在下面这张描绘古罗马市场的图像中,场景细节丰富,人物轮廓清晰,高度忠实再现。

35mm电影静帧,古罗马市场白天的场景。身着传统古罗马服饰的人们在进行货物交换,摊位上有水果、蔬菜和陶器,背景中还可以看到斗兽场。

II. 在当前版本中,可以在提示中指定多个主题/颜色和其他细节。在准确遵循提示方面,根据用户测试,有了显著的改进。

一个20岁的阿拉伯女子,穿着拳击装备,扎着编发,戴着手套,微笑着。

现在,让我们来看一系列描绘非洲草原的图像,有一家狮子家族、夕阳、草原,以及狮子幼崽脸上的沉思表情。细节之丰富令人惊叹。

纪实摄影作品,非洲草原上的一家狮子家族,在夕阳下。场景包括一只雄狮、一只雌狮和它们的幼崽。背景是刺槐树和落日。

III. 当前版本在处理文本方面的准确性和整合性大大提高。文本绘制能力也有所提升。然而,不幸的是,它在除英语以外的语言方面仍然存在困难。尽管如此,它现在完全能够为图像生成进行文本样式化。

绘制文本在图像上的能力显著提高!

一个写着“开到很晚”的霓虹灯招牌的角落酒吧。

在另一个例子中,可口可乐的字体被完美地复制了出来。文字与图像风格融为一体。看起来设计师们已经没有了挑战。

可口可乐广告,以传统夏威夷图案为设计的汽水罐。

IV. 在肖像方面,V5已经达到了相当高的逼真水平。

然而,在V6中,脸上的细小颗粒、帽檐上的皱纹和污垢以及鼻子上的光影变化,使V5.2拍摄的照片看起来更像经过美化的、过于平坦的效果。甚至在雀斑方面,V6的表现更加令人信服,显示出与人类特征呈现一致的浓度,而不是瓷砖效果。

一个老煤矿工人的极特写,他的眼睛没有焦点,脸上被黄金时段的光线照亮。

一个美丽的少女穿着白色裙子,戴着小银耳环,在花园里,柔和的晨光下。

一个45岁的银发女厨师站在一个复古风格餐厅里繁忙的厨房,透过一个小圆窗户望着繁忙的城市街道,她面前的木桌上放着新鲜出炉的面包。

在宣布中,Midjourney指出:

- V6对提示更加敏感。请避免使用“令人印象深刻”、“逼真”、“4k”或“8k”等无用的词语。 - 对于您想要的内容,请明确表达。虽然可能没有那么激动人心,但明确可以帮助模型更好地理解您的意图。

让我们看一些史诗科幻场景的例子:

一个动态的电影静帧,展示了一场史诗级的太空战斗,光滑的星际战斗机在巨大的太空站旁飞驰,激光射击,背景中可见一个遥远的行星。

35mm电影静帧,展示了一艘光滑的玛瑙战舰悬停在空中,呈现出柔和的沙漠异星科幻风格。

根据用户测试,V6甚至可以理解标点符号和语法的微妙差异。这个升级将对整体用户体验产生重大影响。针对这一变化,设计师提供了一些最适合Midjourney的新提示技巧:关键是清晰明了,不炫耀,以及结构化表达。

在水坑里倒映着日落的景象。

就模型知识而言,V6演进过程中的一个小细节相当有代表性。例如,如果提示是“日本女性”,V6可以区分不同亚洲民族之间微妙的外貌差异。与V5.2相比,图像中的女性确实具有更明显的日本特征。这种理解欧洲人无法理解的亚洲面部特征差异的能力,已经被AI实现了。

Midjourney V6展示出的强大能力似乎对摄影师和设计团队构成了更加真实的威胁。它的审美和创造和谐氛围的能力已经与高端摄影师不相上下。更令人恐惧的不仅是它所展示的能力,更是其演进的速度。在Midjourney的宣布中,他们还提到V6的速度、图像质量、连贯性、提示遵循和文本准确性将在未来几周内有所提高。在V6测试版发布仅半小时后,第一个更新就宣布了,将生成速度提高了2.7倍。
AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

感兴趣的小伙伴,赠送全套AIGC学习资料和安装工具,包含AI绘画、AI人工智能等前沿科技教程,模型插件,具体看下方。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

图片

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!

在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。

在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

这份完整版的AIGC全套学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值