Gemini API 集成 Imagen 3，带来更强大的图像生成功能

Android 开发者

于 2025-05-09 17:33:42 发布

阅读量606

点赞数 7

文章标签： Imagen

本文链接：https://blog.csdn.net/androiddevs/article/details/147842621

版权

作者 / 产品经理 Ivan Solovyev

开发者现在可以通过 Gemini API 访问 Google 最先进的图像生成模型 Imagen 3。该模型最初仅对付费用户开放，不久后也将面向免费用户推出。

🔗 Gemini API

https://ai.google.dev/gemini-api/docs/imagen

🔗 Imagen 3

https://ai.google.dev/gemini-api/docs/imagen

🔗 付费用户

https://ai.google.dev/gemini-api/docs/billing

Imagen 3 擅长生成具有视觉吸引力、无伪影且风格多样的图像，从超现实主义图像到印象派风景，从抽象构图到动漫角色等应有尽有。改进后的提示遵循能力使其能够轻松地将绝佳创意转化为高质量图像。总体而言，Imagen 3 在各种基准测试中展现出了最先进的性能。通过 Gemini API 使用 Imagen 3 的价格为每张图像 0.03 美元，并且用户可以控制宽高比、生成选项数量等更多参数。

🔗 基准测试

https://deepmind.google/technologies/imagen-3/#benchmarks

🔗 更多参数

https://ai.google.dev/gemini-api/docs/imagen

为了帮助遏制错误信息和错误归因，所有由 Imagen 3 生成的图像都包含一个不可见的数字 SynthID 水印，用于识别它们为 AI 生成的图像。

🔗 SynthID

https://deepmind.google/technologies/synthid/

了解 Imagen 3 的实际效果

下方图库展示了 Imagen 3 在多种风格图像上的卓越表现。

△ 提示：一群看起来很开心的人，自然光，8k

△ 提示：人物装扮为 20 世纪 20 年代时髦女郎风格，超现实主义肖像，复古风格，黑白照片，优雅的姿势，8k

△ 提示：设想一块复古手表的特写。生成描绘手表精细机械结构的写实图像

△ 提示：印象派风景画，描绘向日葵花田上的日落景象，色彩鲜艳，笔触厚重，灵感来自莫奈

△ 提示：超现实的梦境，巨大的乌龟背上长着郁郁葱葱的森林，漂浮在星空中，闪闪发光的蘑菇，自然发光的植物，空灵的氛围

△ 提示：新鲜烘焙的咖啡豆从粗麻布袋中洒落在原木质地的桌上，旁边的咖啡杯中热气升腾，杯子上用草书写着 "Awaken Your Senses"，温暖迷人的氛围，晨光，产品摄影

△ 提示：超现实主义肖像，一位有着锐利蓝眼睛、正在大笑、有雀斑的女性，戏剧性光影，肌肤纹理细腻，8k

△ 提示：黎明时分壮丽的山脉全景

△ 提示：显示游戏中的场景，玩家需要在凌乱的桌子抽屉中寻找到特定的物品

△ 提示：以梵高风格绘制的城市景观，笔触旋转，色彩鲜艳

开始使用 Gemini API 中的 Imagen 3

此 Python 代码段展示了如何使用 Gemini API 和 Imagen 3 生成图像。

from google import genaifrom google.genai import typesfrom PIL import Imagefrom io import BytesIO
client = genai.Client(api_key='GEMINI_API_KEY')
response = client.models.generate_images(    model='imagen-3.0-generate-002',    prompt='a portrait of a sheepadoodle wearing cape',    config=types.GenerateImagesConfig(        number_of_images=1,    ))for generated_image in response.generated_images:  image = Image.open(BytesIO(generated_image.image.image_bytes))  image.show()

图像已生成