AI绘画|“Midjourney V6革新：AI艺术创作的新高度？”

最新推荐文章于 2024-08-22 13:51:55 发布

AI想象家

最新推荐文章于 2024-08-22 13:51:55 发布

阅读量646

点赞数 14

文章标签：人工智能 AI作画 midjourney stable diffusion prompt openAI 计算机视觉

本文链接：https://blog.csdn.net/J708090/article/details/140371039

版权

Midjourney在Discord上宣布了最新版本V6的测试版发布。经过9个月的训练，尽管没有明确的比较基准，但根据用户测试所展示的能力来看，可以说它是目前最先进的文本到图像模型。

让我们总结一下这个版本与之前版本V5相比的关键升级：

1. 改进的图像放大器，将分辨率提高一倍。 2. 更准确的提示跟随和更长的提示，支持300个字符以上。 3. 提升的连贯性和模型知识，更好地理解您描述的语义含义。 4. 改进的图像提示和混合。 5. 提高的文本绘制能力，支持图像文本生成。

简而言之，V6具有更强的语义理解和图像生成能力，可以容纳更多文字，实现更个性化的图像设计，并且分辨率提高一倍。

就图像质量而言，Midjourney V6相较于之前的版本有了飞跃。以下是V5和V6图像的比较，可以看到V6生成的图像具有出色的质感、光照和结构真实感。

I. 与V5.2相比，V6的图像更加丰富和逼真。

V6在图像生成能力方面的改进显著。与V5.2相比，V6的图像更加丰富和逼真。V5.2在细节方面已经能够产生“逼真”的结果，但V6则更加“真实”而非“模拟”。如果提示准确，结果甚至具有类似相机拍摄的真实质感。

例如，当比较两碗牛肉土豆炖菜时，V6生成的版本无疑更具食欲。

一锅带有木勺的炖菜，自上而下的视角。

现在，让我们来看一组描绘侏罗纪时代的图像，人类在科幻背景下赶走一只暴龙。细节丰富，逼真感十足。

电影般的画面，一只暴龙被一架阿帕奇直升机袭击，森林起火，背景中爆炸着。

在下面这张描绘古罗马市场的图像中，场景细节丰富，人物轮廓清晰，高度忠实再现。

35mm电影静帧，古罗马市场白天的场景。身着传统古罗马服饰的人们在进行货物交换，摊位上有水果、蔬菜和陶器，背景中还可以看到斗兽场。

II. 在当前版本中，可以在提示中指定多个主题/颜色和其他细节。在准确遵循提示方面，根据用户测试，有了显著的改进。

一个20岁的阿拉伯女子，穿着拳击装备，扎着编发，戴着手套，微笑着。

现在，让我们来看一系列描绘非洲草原的图像，有一家狮子家族、夕阳、草原，以及狮子幼崽脸上的沉思表情。细节之丰富令人惊叹。

纪实摄影作品，非洲草原上的一家狮子家族，在夕阳下。场景包括一只雄狮、一只雌狮和它们的幼崽。背景是刺槐树和落日。

III. 当前版本在处理文本方面的准确性和整合性大大提高。文本绘制能力也有所提升。然而，不幸的是，它在除英语以外的语言方面仍然存在困难。尽管如此，它现在完全能够为图像生成进行文本样式化。

绘制文本在图像上的能力显著提高！

一个写着“开到很晚”的霓虹灯招牌的角落酒吧。

在另一个例子中，可口可乐的字体被完美地复制了出来。文字与图像风格融为一体。看起来设计师们已经没有了挑战。

可口可乐广告，以传统夏威夷图案为设计的汽水罐。

IV. 在肖像方面，V5已经达到了相当高的逼真水平。

然而，在V6中，脸上的细小颗粒、帽檐上的皱纹和污垢以及鼻子上的光影变化，使V5.2拍摄的照片看起来更像经过美化的、过于平坦的效果。甚至在雀斑方面，V6的表现更加令人信服，显示出与人类特征呈现一致的浓度，而不是瓷砖效果。

一个老煤矿工人的极特写，他的眼睛没有焦点，脸上被黄金时段的光线照亮。

一个美丽的少女穿着白色裙子，戴着小银耳环，在花园里，柔和的晨光下。

一个45岁的银发女厨师站在一个复古风格餐厅里繁忙的厨房，透过一个小圆窗户望着繁忙的城市街道，她面前的木桌上放着新鲜出炉的面包。

在宣布中，Midjourney指出：

- V6对提示更加敏感。请避免使用“令人印象深刻”、“逼真”、“4k”或“8k”等无用的词语。 - 对于您想要的内容，请明确表达。虽然可能没有那么激动人心，但明确可以帮助模型更好地理解您的意图。

让我们看一些史诗科幻场景的例子：

一个动态的电影静帧，展示了一场史诗级的太空战斗，光滑的星际战斗机在巨大的太空站旁飞驰，激光射击，背景中可见一个遥远的行星。

35mm电影静帧，展示了一艘光滑的玛瑙战舰悬停在空中，呈现出柔和的沙漠异星科幻风格。

根据用户测试，V6甚至可以理解标点符号和语法的微妙差异。这个升级将对整体用户体验产生重大影响。针对这一变化，设计师提供了一些最适合Midjourney的新提示技巧：关键是清晰明了，不炫耀，以及结构化表达。

在水坑里倒映着日落的景象。

就模型知识而言，V6演进过程中的一个小细节相当有代表性。例如，如果提示是“日本女性”，V6可以区分不同亚洲民族之间微妙的外貌差异。与V5.2相比，图像中的女性确实具有更明显的日本特征。这种理解欧洲人无法理解的亚洲面部特征差异的能力，已经被AI实现了。

Midjourney V6展示出的强大能力似乎对摄影师和设计团队构成了更加真实的威胁。它的审美和创造和谐氛围的能力已经与高端摄影师不相上下。更令人恐惧的不仅是它所展示的能力，更是其演进的速度。在Midjourney的宣布中，他们还提到V6的速度、图像质量、连贯性、提示遵循和文本准确性将在未来几周内有所提高。在V6测试版发布仅半小时后，第一个更新就宣布了，将生成速度提高了2.7倍。
AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。未来，AIGC技术将在游戏和计算领域得到更广泛的应用，使游戏和计算系统具有更高效、更智能、更灵活的特性。同时，AIGC技术也将与人工智能技术紧密结合，在更多的领域得到广泛应用，对程序员来说影响至关重要。未来，AIGC技术将继续得到提高，同时也将与人工智能技术紧密结合，在更多的领域得到广泛应用。

感兴趣的小伙伴，赠送全套AIGC学习资料和安装工具，包含AI绘画、AI人工智能等前沿科技教程，模型插件，具体看下方。

在这里插入图片描述