DALL·E 3 和 Midjourney 是您现在可以使用的两个最大的 AI 艺术生成器。两者都可以接受文本提示并生成一系列匹配的图像,无论您的请求多么奇怪或狂野。虽然 DALL·E 3 是 DALL·E 2 是掀起生成式 AI 热潮的 AI 图像模型,Midjourney 提供了更强大的功能。
自从这两个图像生成器发布以来,我一直在专业和个人方面测试它们,并且有很多东西需要解读。所以让我们开始吧。
How do DALL·E 3 和 Midjourney 有效?
Both DALL·E 3 和 Midjourney 接受了数百万或数十亿个文本图像对的训练,这使他们能够理解狗、猎鹿帽和黑暗的情绪照明等概念。这就是他们如何解析像 “一幅印象派油画,描绘一个加拿大男人骑着驼鹿穿过枫树林 ”这样的提示要求他们创造什么。
当涉及到实际生成图像时,他们使用一种称为扩散的过程。他们从一个随机的噪声区域开始,然后通过多个步骤对其进行编辑以更好地匹配他们对提示的解释。这就是为什么即使您第二次尝试相同的提示,您每次都会得到不同的结果:起始种子的随机性可以完全改变最终结果。在之前的一篇文章中,比较了 DALL·E 3 和 Stable Diffusion,我把这个过程描述得有点像抬头看多云的天空,找到一朵看起来有点像狗的云,然后打个响指,让它越来越像狗。虽然事情远不止于此,但思考问题的方式并不坏。
当然,仅仅因为这两个模型使用相同的技术来生成图像,并不意味着您将从两个 DALL·E 和 Midjourney。每个模型如何解释您的提示、它对各种参数的权重、它训练的数据、它尝试重新创建的图像类型以及负责开发它的公司的理念都会极大地影响输出的外观。
这是 DALL·E 3 对“一幅印象派油画,描绘了一位加拿大男子骑着驼鹿穿过枫树林”。
这是 Midjourney 的。