Azure AI-102 认证全攻略: (四十三) DALL·E

本文链接：https://blog.csdn.net/liu1983robin/article/details/145434584

提取的目录（仅保留第一级）

DALL·E 模型概述
环境准备
模型部署
图像生成
使用代码自动化生成图像
资源清理
重要观点和事实
总结

随着生成式人工智能的崛起，图像生成技术已经变得更加先进，DALL·E 是其中的佼佼者。作为一种基于文本提示生成图像的模型，DALL·E 在创意设计、广告、教育等领域展现出了巨大的潜力。本文将为大家提供一份详细的使用指南，帮助准备 Azure AI-102 认证的考生了解如何在 Azure 或 OpenAI Studio 中部署和使用 DALL·E 进行图像生成，重点介绍环境配置、模型部署、图像生成与代码自动化等关键步骤。

DALL·E 模型概述

DALL·E 是 OpenAI 开发的一种图像生成模型，它能够根据用户提供的文本描述生成符合描述的图像。DALL·E 2 和 DALL·E 3 是该模型的两个版本，各自有不同的特点和优势。

DALL·E 2：相比 DALL·E 1，DALL·E 2 提升了图像的生成质量和细节表现，能够处理更复杂的文本描述，并生成更加自然、细腻的图像。DALL·E 2 基于 OpenAI 的 CLIP 模型（对比语言-图像预训练），通过这一技术，模型能够理解复杂的语境，将文本信息转化为高质量的图像。
DALL·E 3：是 DALL·E 系列的最新版本，提供更高的图像质量、更精细的细节，以及更加灵活的图像风格调整。DALL·E 3 的文本理解能力更强，能更准确地处理多层次的语境，支持生动色彩、自然风格等多种图像样式选择，生成的图像更加细致，效果更自然。然而，相比 DALL·E 2，DALL·E 3 的生成时间较长。

DALL·E 模型的最大优势在于它能够从简单的文本提示中创造出独一无二的图像，广泛应用于广告创意、艺术创作、数据可视化等多个领域。

环境准备

要在 Azure AI Studio 或 OpenAI Studio 中使用 DALL·E 模型，首先需要为模型部署准备合适的环境。以下是为使用 DALL·E 模型所需的基本步骤。

选择支持 DALL·E 的区域

在 Azure 上使用 DALL·E 时，必须选择一个支持 OpenAI 模型的区域。目前，DALL·E 模型仅在特定区域可用（例如 East US、瑞典中部、欧洲北部等）。你可以通过 Azure 区域可用性页面查看具体支持 DALL·E 的区域。确保你的 Azure 订阅支持这些区域，以便顺利部署模型。

创建 OpenAI 资源

登录 Azure Portal，选择创建新的 OpenAI 资源。
在 “区域” 中选择一个支持 DALL·E 模型的区域。
完成资源创建后，你将获得相关的 API 密钥和端点，这些信息将在代码中用于访问 DALL·E 模型。

请求 DALL·E 访问权限

在 Azure 或 OpenAI Studio 中，DALL·E 模型需要单独申请访问权限。通过 Model Catalog，你可以向 OpenAI 请求访问 DALL·E 模型。成功申请后，你将能够在平台上部署 DALL·E 模型并开始生成图像。

模型部署

在这里插入图片描述

在 Azure 中部署 DALL·E 模型

在这里插入图片描述

登录 Azure Portal。
搜索并选择 “OpenAI” 服务。
在 OpenAI 资源中选择 “创建资源”。
选择支持 DALL·E 的区域（例如美国东部、欧洲北部）。
配置资源，包括订阅、资源组、模型版本（选择 DALL·E 2 或 DALL·E 3）等。

在 OpenAI Studio 中请求并部署模型

在 OpenAI Studio 中，你可以通过访问 Model Catalog 请求 DALL·E 模型的使用权限。按照平台的指导，完成模型部署。

一旦模型成功部署，你就可以通过 OpenAI Studio 提供的图像生成页面进行图像生成，也可以通过 Python SDK 进行自动化操作。

图像生成

DALL·E 通过解析输入的文本提示生成图像。生成图像时，你可以选择不同的选项，如图像尺寸、风格和生成数量。以下是使用 DALL·E 生成图像的具体步骤。

使用 OpenAI Studio 生成图像

登录到 OpenAI Studio。
选择已经部署的 DALL·E 模型。
在文本框中输入你的图像描述，例如 “A futuristic city on Mars”。
选择生成图像的数量（通常为 1 或 3 张）和图像尺寸（如 1024x1024）。
点击 “生成” 按钮，等待图像生成。

调整生成图像的风格

DALL·E 3 提供了多种风格选项，例如：

Vivid（生动）：图像颜色更加鲜艳，适合用作宣传、广告等。
Natural（自然）：图像效果更加自然，适合用于场景重建和写实风格。

你可以根据需求选择不同的风格，以得到最佳的图像效果。

使用代码自动化生成图像

在这里插入图片描述

为了更加灵活地操作 DALL·E，我们可以使用 Python SDK 来自动化生成图像。以下是一个简单的 Python 代码示例，展示了如何使用 openai 包与 DALL·E 进行交互。

安装必要的 Python 包

!pip install openai

编写 Python 代码生成图像

import openai
import requests
import datetime

# 配置 API 密钥
openai.api_key = "your_api_key_here"

# 生成图像
response = openai.Image.create(
    prompt="Tori gate on the moon",  # 输入图像描述
    n=1,  # 生成 1 张图像
    size="1024x1024"  # 图像尺寸
)

# 获取生成图像的 URL
image_url = response['data'][0]['url']

# 下载并保存图像
img_data = requests.get(image_url).content
with open(f'tori_gate_{datetime.datetime.now()}.png', 'wb') as handler:
    handler.write(img_data)

通过上述代码，你可以在 Jupyter Lab 或其他 Python 环境中自动生成图像，并将其保存到本地。确保你的 api_key 和 endpoint 已正确设置。

资源清理

使用 DALL·E 模型时，及时清理不再使用的资源是非常重要的。长时间不使用的模型和计算资源会导致不必要的成本。

如何清理资源

在 Azure Portal 中，删除不再需要的 OpenAI 资源。
在 OpenAI Studio 中，停止任何正在运行的计算会话。
定期检查是否有未使用的资源，并进行清理。

这样可以有效控制成本，避免浪费不必要的计算和存储资源。

重要观点和事实

区域限制：DALL·E 模型只在特定区域（如 East US、瑞典中部、欧洲北部等）可用。确保你的资源部署在支持 DALL·E 的区域。
DALL·E 2 与 DALL·E 3：DALL·E 3 提供了更高质量的图像，但生成时间较长。根据需求选择适合的模型。
API 密钥和端点：获取 API 密钥和端点后，才可以通过代码与 DALL·E 模型进行交互。
资源清理：不要忘记在完成任务后清理不再使用的资源，避免产生不必要的费用。

总结

DALL·E 是一个强大的工具，可以帮助你根据文本描述生成高质量的图像。在 Azure 或 OpenAI Studio 上部署并使用 DALL·E，可以为你的创意项目、数据分析甚至是日常工作提供强有力的支持。通过本篇文章的学习，你不仅了解了如何部署 DALL·E，还掌握了如何通过 Python 代码自动化生成图像以及如何控制成本。

掌握这些技能，不仅对 Azure AI-102 认证考试有帮助，也能帮助你在实际工作中更加高效地利用人工智能技术解决问题。