OpenAI家又上新了，输入文本就能生成高质解析图片。怎么用呢？

最新推荐文章于 2024-05-25 17:06:37 发布

wawa_nudt

最新推荐文章于 2024-05-25 17:06:37 发布

阅读量4.7k

点赞数

文章标签：语言模型 nlp ai 自然语言处理

本文链接：https://blog.csdn.net/wawa_nudt/article/details/124175961

版权

AI人工智能预训练模型的发展一日千里，在许多方面展现超越人类的能耐，例如，Open AI通过自家开发的Bots让《Dota 2》游戏顶尖高手在一场表演赛中首尝败北的滋味；AI还会写文章，由OpenAI研究实验室推出的GPT-2及GPT-3预训练语言模型，因为能书写出媲美人类文笔的文章，因而成为某些人撰写假新闻、伪文章的利器。如今，OpenAI推出新一代的DALL·E 2系统，只要输入一段描述文本，AI便能帮你产生各种图片。

2021年1月，Open AI推出基于GPT-3与DALL·E的图片识别系统CLIPDALL·E，可将用户输入的文本转变成生动的超现实主义图片。例如，用户可以用文本进行描述，要求DALL·E产生一张蝴蝶带动的在海上航行的轮船图片，或是两只泰迪熊在月球上进行新AI研究的图片，其超现实的程度甚至媲美超现实主义画家达利（Salvador Dalí）， “DALL·E”这个字就是达利与迪士尼电影《瓦力》（WALL-E）机器人这两个名字的组合。

第一代的DALL·E图片像素只有256×256，如今第二代的DALL·E 2图片画质可达1024×1024，分辨率与低延迟的表现更佳。如今DALL·E 2更新了CLIP系统，并改名叫unCLIP。该新系统支持扩散的处理效果，该程序会先从随机点形成的图案开始，一旦取得更具体的描述重点后，会渐近地转变成图片。

除了产生新图片外，用户还可通过DALL·E 2变更现有图片中的一部分，例如在水池图片中添加一只鸭子或去除某个对象，系统同时会将阴影、反光及材质等特征因素纳入考量。用户还可以根据原始图片，发挥创意地额外产生不同风格、内容或角度的变体图片。

如同语言模型会被拿来产生假新闻一样，DALL·E 2之类的图片产生工具也有可能遭到滥用。对此，OpenAI提供了一些保护机制，包括隐私方面的考虑（用户无法根据姓名生成人像照）以及公序良俗方面的考虑（无法生成或上传令人反感的内容）。再者，除了仇恨、骚扰、暴力、自残、裸露及非法活动等主题严禁涉及外，也禁止产生包括假新闻、政治、医疗乃至疾病相关的图片。

未来，Open AI有可能不会直接公开推出DALL·E 2，而会提供给第三方App使用。

又是不直接公开！

是不是已经跃跃欲试，想去动手开发新应用了？发现又是不直接公开！

GPT-3并不向中国的用户开发申请。看来技术有时候也是有国界的。

不过没有关系，中国版的GPT-3于2021年9月就上线了——源1.0大模型。浪潮源1.0大模型开源了向人工智能应用开发者群体进行开源开放，开放内容包含开放模型API，开放高质量中文数据集，开源模型训练代码、推理代码和应用代码等。只要你有创意，零代码低代码就可以开发超高级的AI应用。

开放平台：https://air.inspur.com/，可进行模型API、中文数据集的申请使用。

开发者社区：https://github.com/Shawn-Inspur/Yuan-1.0，可浏览训练代码、推理代码和应用示例代码。

wawa_nudt

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
OpenAI家又上新了，输入文本就能生成高质解析图片。怎么用呢？

AI人工智能预训练模型的发展一日千里，OpenAI家又上新了，输入文本就能生成高质解析图片，可惜不公开使用。想体验大模型的能力，可以使用中国版的Yuan1.0大模型。
复制链接

扫一扫