DALL·E 3 比我们以前的系统能够理解更多的细微差别和细节,让您可以轻松地将您的想法转化为极其精确的图像。
现代文本转图像系统往往会忽略文字或描述,迫使用户接受机器的提示来完成。DALL·E 3 代表了我们在生成与您提供的文本完全一致的图像方面的能力的一次飞跃。
“
樱花树下,一位妇女正在黄色格子毯子上准备野餐。
湖水里,一群人坐在划艇上,享受着日落的宁静。
夕阳照亮了池塘周围盛开的樱花树。
远处,一座日式建筑风格的建筑坐落在湖畔。
”
即使使用相同的提示,DALL·E 3 也比 DALL·E 2 有显著改进。
DALL·E 2
一幅富有表现力的油画,描绘了一块浸在牛奶中的巧克力饼干,呈现出一种味道爆炸的感觉:
DALL·E 3
一幅富有表现力的油画,描绘了一块浸在牛奶中的巧克力饼干,呈现出一种味道爆炸的感觉:
DALL·E 3 是基于 ChatGPT 本地构建的,它允许您使用 ChatGPT 作为头脑风暴伙伴和提示的改进者。从简单的句子,到详细的段落,只需询问 ChatGPT你想看到什么即可。
当有人提出想法时,ChatGPT 会自动为 DALL·E 3 生成定制的详细提示,让你的想法变为现实。如果你喜欢某张图片,但又不太合适,你可以用几句话让 ChatGPT 进行调整。
安全
与之前的版本一样,我们已经采取措施限制 DALL·E 3 生成暴力、成人或仇恨内容的能力。
DALL·E 3 有权拒绝指名道姓询问公众人物的请求。
我们与红队成员(对模型进行压力测试的领域专家)合作,提高了公众人物相关内容的,与视觉过度相关或者不相关的有害偏见等风险领域的安全性能,以帮助我们进行风险评估,以及减轻宣传和错误信息带来的负面影响。
我们正在研究最佳的方案,来帮助人们辨别一副图像何时是由AI创建的。
我们正在试验起源分类器(一种新的内部工具,可以帮助我们识别图像是否由 DALL·E 3 生成),并希望使用此工具更好地了解生成的图像的使用方式。
创意控制
DALL·E 3被设计为拒绝提供有关现存艺术家风格图像的请求。创作者现在还可以选择将他们的图像排除在我们未来的图像生成模型的训练之外。
“一碗热气腾腾的拉面,柔软的面条,多汁的烤豆腐片,鲜亮的葱花,溏心的蛋黄,金黄色的玉米,撒上芝麻,在温暖的灯光下,全部浸泡在浓郁可口的汤汁中。”
“想象一下一幅具有复古感的植物插图,描绘了一朵盛开的大而鲜艳的黄色花朵,旁边是花蕾和带有复杂细节的浓绿叶子。这种媒介让人想起手绘水彩画,笔触精准细腻,栩栩如生地呈现了植物。它具有整体古典和科学的美感,仿佛取自旧世界的植物标本馆。”
“一只来源于折纸灵感的山羊,带有几何褶皱,位于一片超现实的土地上:糖果色的树木、带着阳光的微笑太阳,以及在棉花般的云朵下玩耍的 3D 动画小孩。明亮、梦幻般的灯光增强了欢乐的气氛。”
“一株大型、纹理丰富的仙人掌,呈渐变的绿色色调,尖刺突出,由玩具积木组成。它位于沙漠地面上的小仙人掌中间,在湛蓝的天空下,呈现出沙砖纹理,投射出清晰的阴影。”