从去年年底,openAI的ChatGPT火遍全球,今年,openAI也发布了它的DALL·E models,一个用于生产图片和修改图片的模型。
它的API提供三种对图片操作的方法:
1. 用文字生成图片;
2. 用文字修改图片;
3. 生成已有图片的变体。
本文主要介绍第1中方法,即用文字生成图片。主要分为以下几个部分:
- 准备环节
- 如何调取API
- 案例
- 注意事项
准备环节
1. 安装python环境,具体可见这个教程
2. 在terminal中用下面的命令行安装openAI的library
pip install openai
3. 到OpenAI的官网中注册一个账号,然后生成一个api key,生成后注意保存下来。
如何调取API
对于非程序员来说,这个环节看起来很高级,但实际上是最简单的环节,因为只需复制要几行代码即可完成。创建一个Jupyter notebook文件,复制以下代码,将其中的openai.api_key后面那串字符换成在上一步中你获得那个api key。在create这个函数中,有三个参数可以调节:
1. `prompt`: 你想生产图片的文字,支持中英文;
2. `n`: 生成图片的数量;
3. `size`: 生成图片的分辨率大小,支持三种格式:1024×1024,512x512,256x256。
import os
import openai
openai.api_key = your_api_key
openai.Image.create(
prompt='''A cat is sitting on a desk.''',
n=2,
size="512x512"
)
然后`Shift+Enter`,即可看到以下运行结果,其中两个url就是生成图片的地址。
案例
不断调整prompt中的文字,你会得到不同的图片,如果图片不满意,你可以加入更多的细节,甚至说明图片的风格。下面是我的两个例子:
1. “Two cats are watching the earth from space. The two cats are a couple. The cat is on the right of the image, and the earth is on the left of the image. The background is a black sky with scattering stars. The style is science fiction”
2. “Two dogs are watching the eruption of volcano De Fuego on a mountain. The two dogs are a couple. The dogs are on the right of the image, and the volcano is on the left of the image. The foot of one dog must be on another dog's shoulder. The style is science fiction and romantic”
科幻浪漫风格的两只狗一起看火山。
注意事项
以下OpenAI 的api收费标准为,0.016-0.020美元一张图。