DALL-E 2输出的“泰迪熊像一个蒸汽朋克时代的疯狂科学家一样混合闪闪发光的化学物质”的结果
DALL-E的问世曾让人们惊艳于AI根据一段话直接生成图像的能力,如今一年过去,OpenAI开发了一个新版本的DALL-E,效果较之前又更好了。
如下图所示,DALL-E 2实现了更高分辨率和更低延迟,而且还包括了新的功能,如编辑现有图像。
与之前的OpenAI工作一样,新工具没有直接向公众发布。但研究人员可以在线注册预览该系统,OpenAI希望以后能将其用于第三方应用。
从穿着法兰绒衬衫的人体描绘到“乌龟长颈鹿”、萝卜遛狗等匪夷所思的画面,2021年DALL-E的text to image生成效果,让人们一窥多模态的潜力,也带动着多模态图像合成与编辑方向的大火,前有 DALL-E、GauGAN2,后有统一的多模态预训练模型“女娲”。这些连接文本和视觉领域的技术创新使我们更接近实现多模态AI系统。
DALL-E 刚刚对外宣布的时候,OpenAI表示将继续在该系统的基础上进行开发,同时检查图像生成中的偏见或错误信息的产生等潜在危险。
OpenAI试图通过技术保障措施和新的内容政策来解决这些问题,