OpenAI API 中文文档 - 图像生成

图像生成

了解如何使用我们的 DALL·E 模型

介绍

图像 API 提供了三种与图像交互的方法:

  1. 根据文本提示从头开始创建图像
  2. 根据新的文本提示创建现有图像的编辑
  3. 创建现有图像的变体

本指南介绍了使用这三个 API 终结点的基础知识以及有用的代码示例。要了解它们的实际效果,请查看我们的 DALL·E 预览应用程序

图像 API 处于测试阶段。在此期间,API 和模型将根据你的反馈进行改进。为了确保所有用户都能舒适地制作原型,默认速率限制为每分钟 50 张图像。您可以在我们的速率限制指南中了解有关速率限制的更多信息。

用法

图像生成终结点允许您在给定文本提示的情况下创建原始图像。生成的图像的大小可以是 256x256、512x512 或 1024x1024 像素。较小的尺寸生成速度更快。您可以使用 n 参数一次请求 1-10 张图像。

response = openai.Image.create(
  prompt="a white siamese cat",
  n=1,
  size="1024x1024"
)
image_url = response['data'][0]['url']

描述越详细,就越有可能获得您或您的最终用户想要的结果。您可以在 DALL·E 预览应用程序,以获得更多提示灵感。下面是一个快速示例:

可以使用 response_format 参数将每个图像作为 URL 或 Base64 数据返回。网址将在一小时后过期。

编辑

图像编辑端点允许您通过上传遮罩来编辑和扩展图像。蒙版的透明区域指示应编辑图像的位置,提示应描述完整的新图像,而不仅仅是擦除的区域。此端点可以启用类似 DALL·E 预览应用程序

response = openai.Image.create_edit(
  image=open("sunlit_lounge.png", "rb"),
  mask=open("mask.png", "rb"),
  prompt="A sunlit indoor lounge area with a pool containing a flamingo",
  n=1,
  size="1024x1024"
)
image_url = response['data'][0]['url']

提示:阳光明媚的室内休息区,游泳池内有一只火烈鸟

上传的图片和蒙版必须是小于 4MB 的方形 PNG 图片,并且尺寸必须相同。生成输出时不使用蒙版的非透明区域,因此它们不一定需要像上面的例子那样与原始图像匹配。

变化

图像变体端点允许您生成给定图像的变体

response = openai.Image.create_variation(
  image=open("corgi_and_cat_paw.png", "rb"),
  n=1,
  size="1024x1024"
)
image_url = response['data'][0]['url']

与编辑端点类似,输入图像必须是小于 4MB 的方形 PNG 图像。

内容审核

系统会根据我们的内容政策过滤提示和图片,并在举报提示或图片时返回错误。如果您对误报或相关问题有任何反馈,请通过我们的帮助中心与我们联系。

特定语言提示

使用内存中的图像数据

上面指南中的 Node.js 示例使用该模块从磁盘读取图像数据。在某些情况下,您可能将图像数据放在内存中。下面是一个示例 API 调用,它使用 Node.js 对象中存储的图像数据:fs``Buffer

// This is the Buffer object that contains your image data
const buffer = [your image data];
// Set a `name` that ends with .png so that the API knows it's a PNG image
buffer.name = "image.png";
const response = await openai.createImageVariation(
  buffer,
  1,
  "1024x1024"
);

使用 TypeScript

如果您使用的是 TypeScript,您可能会遇到一些图像文件参数的怪癖。下面是通过显式强制转换参数来解决类型不匹配的示例:

// Cast the ReadStream to `any` to appease the TypeScript compiler
const response = await openai.createImageVariation(
  fs.createReadStream("image.png") as any,
  1,
  "1024x1024"
);

下面是内存中图像数据的类似示例:

// This is the Buffer object that contains your image data
const buffer: Buffer = [your image data];
// Cast the buffer to `any` so that we can set the `name` property
const file: any = buffer;
// Set a `name` that ends with .png so that the API knows it's a PNG image
file.name = "image.png";
const response = await openai.createImageVariation(
  file,
  1,
  "1024x1024"
);

错误处理

API 请求可能会由于输入无效、速率限制或其他问题而返回错误。这些错误可以通过语句处理,错误详细信息可以在 或 中找到:try...catch``error.response``error.message

try {
  const response = await openai.createImageVariation(
    fs.createReadStream("image.png"),
    1,
    "1024x1024"
  );
  console.log(response.data.data[0].url);
} catch (error) {
  if (error.response) {
    console.log(error.response.status);
    console.log(error.response.data);
  } else {
    console.log(error.message);
  }
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Spring4GWT GWT Spring 使得在 Spring 框架下构造 GWT 应用变得很简单,提供一个易于理解的依赖注入和RPC机制。 Java扫雷游戏 JVMine JVMine用Applets开发的扫雷游戏,可在线玩。 public class JVMine extends java.applet.Applet 简单实现!~ 网页表格组件 GWT Advanced Table GWT Advanced Table 是一个基于 GWT 框架的网页表格组件,可实现分页数据显示、数据排序和过滤等功能! Google Tag Library 该标记库和 Google 有关。使用该标记库,利用 Google 为你的网站提供网站查询,并且可以直接在你的网页里面显示搜查的结果。 github-java-api github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对业务代码零侵入 2. 支持使用Redis和Memcached作为后端缓存。3. 支持缓存数据分区规则的定义 4. 使用redis作缓存时,支持list类型的高级数据结构,更适合论坛帖子列表这种类型的数据 5. 支持混合使用redis缓存和memcached缓存。可以将列表数据缓存到redis中,其他kv结构数据继续缓存到memcached 6. 支持redis的主从集群,可以做读写分离。缓存读取自redis的slave节点,写入到redis的master节点。 Java对象的SQL接口 JoSQL JoSQL(SQLforJavaObjects)为Java开发者提供运用SQL语句来操作Java对象集的能力.利用JoSQL可以像操作数据库中的数据一样对任何Java对象集进行查询,排序,分组。 搜索自动提示 Autotips AutoTips是为解决应用系统对于【自动提示】的需要(如:Google搜索), 而开发的架构无关的公共控件, 以满足该类需求可以通过快速配置来开发。AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列的数字图像。使用简便和直截了当,用户只需要加载的图片和调整帧您想要的,如位置,时间显示和处理方法前帧。 Java的PList类库 Blister Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端 JOpenID JOpenID是一个轻量级的OpenID 2.0 Java客户端,仅50KB+(含源代码),允许任何Web网站通过OpenID支持用户直接登录而无需注册,例如Google Account或Yahoo Account。 JActor的文件持久化组件 JFile JFile 是 JActor 的文件持久化组件,以及一个高吞吐量的可靠事务日志组件。 Google地图JSP标签库 利用Google:maps JSP标签库就能够在你的Web站点上实现GoogleMaps的所有功能而且不需要javascript或AJAX编程。它还能够与JSTL相结合生成数据库驱动的动态Maps。 OAuth 实现框架 Agorava Agorava 是一个实现了 OAuth 1.0a 和 OAuth 2.0 的框架,提供了简单的方式通过社交媒体进行身份认证的功能。 Eclipse的JavaScript插件 JSEditor JSEditor 是 Eclipse 下编辑 JavaScript 源码的插件,提供语法高亮以及一些通用的面向对象方法。 Java数据库连接池 BoneCP BoneCP 是一个高性能的开源java数据库连接池实现库。它的设计初衷就是为了提高数据库连接池的性能,根据某些测试数据发现,BoneCP是最快的连接池。BoneCP很小,只有四十几K
Spring4GWT GWT Spring 使得在 Spring 框架下构造 GWT 应用变得很简单,提供一个易于理解的依赖注入和RPC机制。 Java扫雷游戏 JVMine JVMine用Applets开发的扫雷游戏,可在线玩。 public class JVMine extends java.applet.Applet 简单实现!~ 网页表格组件 GWT Advanced Table GWT Advanced Table 是一个基于 GWT 框架的网页表格组件,可实现分页数据显示、数据排序和过滤等功能! Google Tag Library 该标记库和 Google 有关。使用该标记库,利用 Google 为你的网站提供网站查询,并且可以直接在你的网页里面显示搜查的结果。 github-java-api github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对业务代码零侵入 2. 支持使用Redis和Memcached作为后端缓存。3. 支持缓存数据分区规则的定义 4. 使用redis作缓存时,支持list类型的高级数据结构,更适合论坛帖子列表这种类型的数据 5. 支持混合使用redis缓存和memcached缓存。可以将列表数据缓存到redis中,其他kv结构数据继续缓存到memcached 6. 支持redis的主从集群,可以做读写分离。缓存读取自redis的slave节点,写入到redis的master节点。 Java对象的SQL接口 JoSQL JoSQL(SQLforJavaObjects)为Java开发者提供运用SQL语句来操作Java对象集的能力.利用JoSQL可以像操作数据库中的数据一样对任何Java对象集进行查询,排序,分组。 搜索自动提示 Autotips AutoTips是为解决应用系统对于【自动提示】的需要(如:Google搜索), 而开发的架构无关的公共控件, 以满足该类需求可以通过快速配置来开发。AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列的数字图像。使用简便和直截了当,用户只需要加载的图片和调整帧您想要的,如位置,时间显示和处理方法前帧。 Java的PList类库 Blister Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端 JOpenID JOpenID是一个轻量级的OpenID 2.0 Java客户端,仅50KB+(含源代码),允许任何Web网站通过OpenID支持用户直接登录而无需注册,例如Google Account或Yahoo Account。 JActor的文件持久化组件 JFile JFile 是 JActor 的文件持久化组件,以及一个高吞吐量的可靠事务日志组件。 Google地图JSP标签库 利用Google:maps JSP标签库就能够在你的Web站点上实现GoogleMaps的所有功能而且不需要javascript或AJAX编程。它还能够与JSTL相结合生成数据库驱动的动态Maps。 OAuth 实现框架 Agorava Agorava 是一个实现了 OAuth 1.0a 和 OAuth 2.0 的框架,提供了简单的方式通过社交媒体进行身份认证的功能。 Eclipse的JavaScript插件 JSEditor JSEditor 是 Eclipse 下编辑 JavaScript 源码的插件,提供语法高亮以及一些通用的面向对象方法。 Java数据库连接池 BoneCP BoneCP 是一个高性能的开源java数据库连接池实现库。它的设计初衷就是为了提高数据库连接池的性能,根据某些测试数据发现,BoneCP是最快的连接池。BoneCP很小,只有四十几K
人工智能技术有哪些_人工智能技术的原理 什么是人工智能人工智能(ArTIficialIntelligence),英文缩写为AI。它是研究 、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术 科学。 人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人 类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识 别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领 域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的容器。人 工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那 样思考、也可能超过人的智能。 人工智能的特点1.人工智能纯系无意识的机械的物理的过程,人类智能主要是生理和心 理的过程。 2.人工智能没有社会性。 3.人工智能没有人类的意识所特有的能动的创造能力。 4.两者总是人脑的思维在前,电脑的功能在后。 人工智能技术有哪些?1、自然语言生成:利用计算机数据生成文本。目前应用于客户服 务、报告生成以及总结商业智能洞察力。代表*厂商包括:AtTIvio、CambridgeSemanTI cs、DigitalReason、Lucidworks、NarraTIveScience和SAS。 2、语音识别:将人类语音转录和转换成对计算机应用软件来说有用的格式。目前应用于 交互式语音应答系统和移动应用领域。代表*厂商包括:NICE、NuanceCommunications、 OpenText和VerintSystems。 3、虚拟代理:弗雷斯特公司声称,虚拟代理可谓是媒体界目前竞相报道的对象。从简单 的聊天机器人,到可以与人类进行交际的高级系统,不一而足。目前应用于客户服务和 支持以及充当智能家居管理器。代表*厂商包括:亚马逊、苹果、ArtificialSolutions 、AssistAI、CreativeVirtual、谷歌、IBM、IPsoft、微软和Satisfi。 4、机器学习平台:不仅提供了设计和训练模型,并将模型部署到应用软件、流程及其他 机器的计算能力,还提供了算法、应用编程接口(API)、开发工具包和训练工具包。目 前应用于一系列广泛的企业应用领域,主要涉及预测或分类。代表*厂商包括:亚马逊、 FractalAnalytics、谷歌、H2O.ai、微软、SAS和Skytree。 5、针对人工智能优化的硬件:这是专门设计的图形处理单元(GPU)和设备,其架构旨 在高效地运行面向人工智能的计算任务。目前主要在深度学习应用领域发挥作用。代表 *厂商包括:Alluviate、克雷、谷歌、IBM、英特尔和英伟达。 6、深度学习平台:一种特殊类型的机器学习,包括拥有多个抽象层的人工神经网络。目 前主要应用于由很庞大的数据集支持的模式识别和分类应用领域。代表*厂商包括:Dee pInstinct、ErsatzLabs、FluidAI、MathWorks、Peltarion、SaffronTechnology和Sen tientTechnologies。 7、生物特征识别技术:能够支持人类与机器之间更自然的交互,包括但不限于图像和触 摸识别、语音和身体语言。目前主要应用于市场研究。代表*厂商包括:3VR、Affectiv a、Agnitio、FaceFirst、Sensory、Synqera和Tahzoo。 8、机器人流程自动化:使用脚本及其他方法,实现人类操作自动化,从而支持高效的业 务流程。目前应用于人类执行任务或流程成本太高或效率太低的地方。代表*厂商包括: AdvancedSystemsConcepts、AutomationAnywhere、BluePrism、UiPath和WorkFusion。 9、文本分析和NLP:自然语言处理(NLP)使用和支持文本分析,为此它借助统计方法和 机器学习方法,为理解句子结构及意义、情感和意图提供方便。目前应用于欺诈检测和 安全、一系列广泛的自动化助理以及挖掘非结构化数据等领域。代表*厂商包括:Basis Technology、Coveo、ExpertSystem、Indico、Knime、Lexalytics、Linguamatics、Mi ndbreeze、Sinequa、Stratifyd和Synapsify。 10,决策管理:引擎将规则和逻辑嵌入到人工智能系统,并用于初始的设置/训练和日常 的维护和调优。这是一项成熟的技术,应用于一系列广泛的企业应用领域,协助或执行 自动决策。代表*厂商包括:AdvancedSystemsConcepts、Informatica、Maana、Pegasy stems和UiPat。 人工智能的原理人工智能是实现具
AIGC(Artificial Intelligence Generated Content,人工智能生成内容)的重要性体现在以下几个方面: 内容创作效率提升: AIGC能够快速生成大量高质量的内容,包括文本、图像、音频、视频等,极大地提高了创作效率。这不仅降低了人力成本,也使得内容更新和迭代的速度加快,满足了信息爆炸时代人们对新鲜内容的高需求。 个性化和定制化服务: AIGC可以根据用户的需求和偏好自动生成个性化的内容。这种能力在教育、娱乐、营销等领域具有巨大价值,能够提供高度定制化的用户体验,增强用户黏性和满意度。 创新与发现新应用: AIGC技术的不断发展和普及促进了新的应用场景和商业模式的诞生。通过降低开发门槛,更多的开发者和企业能够探索和实验AIGC的应用,有可能催生出全新的现象级应用和服务。 商业效益增长: AIGC在数字商业化领域具有显著优势。它能够赋能营销策略,提高广告和推广的精准度和效果,从而带动企业收入的增长。同时,通过自动化的内容生成,企业可以节省资源并专注于核心业务的创新和发展。 知识传播与教育: AIGC能够生成教育材料、教程和知识摘要,帮助人们更高效地获取和学习新知识。在教育领域,AIGC可以个性化定制学习路径和内容,适应不同学生的学习速度和方式。 行业效率优化: 在保险、出版、法律等行业,AIGC可以自动处理大量的文档、报告和合同,提高工作效率,减少人为错误,并提供数据分析和决策支持。 学术研究与伦理考量: AIGC在学术研究中的应用需要遵循特定的使用边界和准则,以防止学术不端行为。明确的指南有助于确保研究成果的真实性和可信度,同时推动AI技术在科研领域的健康发展。
OpenAI API是一个人工智能平台,提供了许多自然语言处理和机器学习相关的API,包括语言生成、问答、语言理解、文本分类、翻译等。以下是OpenAI API的一些常用功能和文档: 1. GPT-3语言生成API GPT-3是OpenAI的一款基于深度学习的语言生成模型,可以生成人类类似的自然语言文本,支持多种应用场景,例如:文本创作、聊天机器人、问答、故事创作等。 文档链接:https://beta.openai.com/docs/api-reference/generating-text/ 2. DALL-E 图像生成API DALL-E是OpenAI的一款基于GAN(生成对抗网络)的图像生成模型,可以根据文字描述生成符合要求的图像,例如:"一只彩色猫头鹰,身体覆盖着柔软的毛发"。 文档链接:https://beta.openai.com/docs/api-reference/images/ 3. Codex 代码生成API Codex是OpenAI的一款基于自然语言处理的代码生成模型,可以根据自然语言描述生成符合要求的代码段,支持多种编程语言,例如:Python、JavaScript、Ruby等。 文档链接:https://beta.openai.com/docs/api-reference/codex/ 4. GPT-3问答API GPT-3问答API可以根据用户提出的问题生成相应的答案,支持多种问答场景,例如:智能客服、知识库问答、语音助手等。 文档链接:https://beta.openai.com/docs/api-reference/question-answering/ 5. API文档和开发者文档 OpenAI API提供了完整的API文档和开发者文档,包括API的使用方法、参数设置、返回结果等详细信息,帮助开发者轻松了解和使用OpenAI APIAPI文档链接:https://beta.openai.com/docs/ 开发者文档链接:https://beta.openai.com/docs/developer-overview/

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值