OpenAI发布DALL-E 2，文字生成图像工具新的“天花板”？

最新推荐文章于 2025-05-20 13:23:35 发布

数据实战派

最新推荐文章于 2025-05-20 13:23:35 发布

阅读量4.8k

点赞数 2

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shujushizhanpai/article/details/124018519

版权

OpenAI推出了DALL-E 2，新一代文本到图像生成工具，具备更高分辨率、更低延迟及编辑现有图像的功能。DALL-E 2基于CLIP和diffusion models，能实现更真实的图像生成。尽管存在潜在的风险，如图像偏见和误导，OpenAI已采取措施确保内容安全，并计划逐步开放给第三方应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在这里插入图片描述

DALL-E 2输出的“泰迪熊像一个蒸汽朋克时代的疯狂科学家一样混合闪闪发光的化学物质”的结果

DALL-E的问世曾让人们惊艳于AI根据一段话直接生成图像的能力，如今一年过去，OpenAI开发了一个新版本的DALL-E，效果较之前又更好了。

如下图所示，DALL-E 2实现了更高分辨率和更低延迟，而且还包括了新的功能，如编辑现有图像。

在这里插入图片描述

与之前的OpenAI工作一样，新工具没有直接向公众发布。但研究人员可以在线注册预览该系统，OpenAI希望以后能将其用于第三方应用。

从穿着法兰绒衬衫的人体描绘到“乌龟长颈鹿”、萝卜遛狗等匪夷所思的画面，2021年DALL-E的text to image生成效果，让人们一窥多模态的潜力，也带动着多模态图像合成与编辑方向的大火，前有 DALL-E、GauGAN2，后有统一的多模态预训练模型“女娲”。这些连接文本和视觉领域的技术创新使我们更接近实现多模态AI系统。

DALL-E 刚刚对外宣布的时候，OpenAI表示将继续在该系统的基础上进行开发，同时检查图像生成中的偏见或错误信息的产生等潜在危险。

OpenAI试图通过技术保障措施和新的内容政策来解决这些问题，

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。