当地时间4月17日,开源图像大模型平台Stability AI在官网宣布,最新的文生图模型Stable Diffusion 3和 Stable Diffusion 3 Turbo的API已经可以使用(使用方式在文末~)。
为了更好地服务于需要同时使用多种模型的公司,Stability AI与API平台Fireworks AI展开了紧密合作。
Stability AI在赚钱方面终于要发力了!未来,Stability AI还计划通过会员服务,在自己的服务器上托管模型,使得更多用户能够享受到便捷高效的服务。
效果展示
根据Stability AI展示的效果可以看出,Stable Diffusion 3 在文字嵌入方面甚至超越了其他文本转图像生成器,如 OpenAI 的 DALL-E 3 和 Midjourney v6。
这款模型采用了Multimodal Diffusion Transformer架构,不仅提高了文本理解能力,还大幅提升了图像生成的准确性和细节表现。
使用方式
使用之前需要注册 Stability AI 账号。新人注册送 20 credits(还是有点少的),注册成功之后可在个人页面查看 API key(替换下方的 sk-MYAPIKEY)。具体调用方式如下:
cURL
curl -f -sS "https://api.stability.ai/v2beta/stable-image/generate/sd3" \
-H "authorization: Bearer sk-MYAPIKEY" \
-H "accept: image/*" \
-F prompt="Lighthouse on a cliff overlooking the ocean" \
-F output_format="jpeg" \
-o "./lighthouse.jpeg"
Python
import requests
response = requests.post(
f"https://api.stability.ai/v2beta/stable-image/generate/sd3",
headers={
"authorization": f"Bearer sk-MYAPIKEY",
"accept": "image/*"
},
files={"none": ''},
data={
"prompt": "dog wearing black glasses",
"output_format": "jpeg",
},
)
if response.status_code == 200:
with open("./dog-wearing-glasses.jpeg", 'wb') as file:
file.write(response.content)
else:
raise Exception(str(response.json()))
Javascript
import fs from "node:fs";
import axios from "axios";
import FormData from "form-data";
const formData = {
prompt: "Lighthouse on a cliff overlooking the ocean",
output_format: "jpeg"
};
const response = await axios.postForm(
`https://api.stability.ai/v2beta/stable-image/generate/sd3`,
axios.toFormData(formData, new FormData()),
{
validateStatus: undefined,
responseType: "arraybuffer",
headers: {
Authorization: `Bearer sk-MYAPIKEY`,
Accept: "image/*"
},
},
);
if(response.status === 200) {
fs.writeFileSync("./lighthouse.jpeg", Buffer.from(response.data));
} else {
throw new Error(`${response.status}: ${response.data.toString()}`);
}
下面是调用接口的价格($1 / 100 credits),使用 SD3 生成图片的单价相对之前还是贵了不少。
Stable Assistant
除Stable Diffusion 3,Stability AI还推出了一个新平台叫Stable Assistant Beta。
对标微软的Copilot,你可以和它聊天,让它帮你生成图片,写文章,甚至把照片和文字搭配起来。虽然现在只对少数用户开放,但已经让人很期待了!
AI的世界充满了奇迹,而我们正站在这一波创新的前沿。如果你对这个有趣的技术感兴趣,别忘了点击关注,一起探索AI的奇妙世界!