独家 | 为DALL·E 2花了15美元创作这幅AI图像以后,我学到了……

本文讲述了作者使用DALL·E 2生成美洲驼灌篮图像的过程,探讨了提示工程的重要性和DALL·E 2在图像合成方面的限制。DALL·E 2虽然能生成创意图像,但在场景理解和元素关系上仍有不足,但它在风格转换上的能力令人印象深刻。
摘要由CSDN通过智能技术生成

a873f90ab554df8fbe54b4ab5af001b6.png

作者:Joy Zhang
翻译:陈超
校对:赵茹萱


本文约3000字,建议阅读8分钟
本文介绍了作者使用DALL·E 2生成了美洲驼灌篮的逼真版图片的过程。

是的,这是一只美洲驼灌篮。一份对DALL·E 2封闭测试版试验的过程、限制以及学习内容的总结。

98157a548bd6369f93e27bd239eac527.png

美洲驼打篮球,DALL·E 2生成

自从我第一次看到那幅人工生成的“柴犬便当盒”(https://twitter.com/hardmaru/status/1522166259890151424)图像时,我就一直在死磕DALL·E 2。

哇哦,现在已经是颠覆性技术了。

对于不熟悉DALL·E 2的人来说,这是一个由OpenAI创建的能够利用文本生成原创图像的系统。他现在处于封闭测试阶段。我在五月初注册了等候者名单,并在七月底获得了使用权限。在测试阶段,用户收到积分(首月免费赠送50积分,之后每月15积分)后,每次花费1积分,就可以生成3-4幅图片。你可以用15美元购买115积分。

P.S. 如果你不想等,也可以免费使用DALL·E mini版本。当然,图像的质量通常会更差(由此产生了一大批DALL·E的表情包https://www.wired.com/story/dalle-ai-meme-machine/),并且每次要花大概60秒的时间(DALL·E 2只需要5秒左右)。

或许你已经看过了许多精心挑选的在线图像表明DALL·E 2是可以的。本文中,我分享了一个如何通过主题“美洲驼打篮球”来创造一幅有用的图片的详细步骤。如果你想自己尝试使用DALL·E 2或者你只是对它能干什么感兴趣的话,你会发现它很有用。

开始

DALL·E 2是科学和艺术的结合。为了阐述这一点,以下给出了“美洲驼打篮球”的结果:

ceccd3a90c9b5e9de6e0d4088e2ee899.jpeg1f4193870640e5f22497c5db5a82ed24.png 图像由作者使用DALL·E 2通过提示“美洲驼打篮球”生成

为什么DALL·E 2倾向于生成卡通图片呢?我假设在训练过程中缺乏关于美洲驼打篮球的真实图像。

我尝试再进一步地增加“逼真图像”的关键词:

手持打造有凝聚力的场景6632f935e202d2ce174a2cb0798dfc31.jpeg

86e5e9e294466ff12eefdc2c0c62c9a5.png

图像由作者使用 DALL·E 2 通过提示“美洲驼打篮球的逼真照片”生成

这张美洲驼照片看起来更写实,但是整幅图看起来像一团糟的ps作品。在这个案例当中,DALL·E 2明显需要一些手持式动作来创造一个更有粘合度的场景。

提示工程,也可以解释为明确你真正想要的东西的艺术

在DALL·E的情境中,提示工程指的是设计提示线索以给出想要结果的过程。

DALL·E 2提示书就是一个绝佳的资源。它有来源于摄影和艺术的关键词组成的详细线索灵感列表。

为什么这样的关键词是必要的呢?因为从DALL·E 2中获得有用的结果是非常挑剔的(尤其是当你不确定DALL·E 2有什么用的时候)。线索如此之多,以至于一家初创公司甚至建立了一个提示线索的市场,收费1.99美元,以此来节约你自己苦思冥想所耗费的时间和金钱。

我个人最喜欢的发现是“戏剧性的背景光”。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值