在本教程中,你将了解如何执行以下操作:
- 通过 Batch 和存储帐户进行身份验证
- 在 Python 中开发和运行脚本
- 创建运行应用程序所需的计算节点池
- 计划 Python 工作负荷
- 监视分析管道
- 访问日志文件
以下示例运行一个 Python 脚本,该脚本从 Blob 存储容器接收 CSV 输入,执行数据处理过程,并将输出写入到单独的 Blob 存储容器。
如果还没有 Azure 订阅,可以在开始前创建一个免费帐户。
先决条件
- 已安装一个 Python 分发版用于本地测试。
- azure-storage-blob
pip
包。 - iris.csv 数据集
- Azure Batch 帐户和关联的 Azure 存储帐户。 有关如何创建 Batch 帐户并将其链接到存储帐户的详细信息,请参阅创建 Batch 帐户。
- 一个 Azure 数据工厂帐户。 有关如何通过 Azure 门户创建数据工厂的详细信息,请参阅创建数据工厂。
- Batch Explorer。
- Azure 存储资源管理器。
登录 Azure
通过 https://portal.azure.com 登录到 Azure 门户。
获取帐户凭据
就此示例来说,需为 Batch 帐户和存储帐户提供凭据。 若要获取所需凭据,一种直接的方法是使用 Azure 门户。 (也可使用 Azure API 或命令行工具来获取这些凭据。)
-
选择“所有服务”>“Batch 帐户”,然后选择 Batch 帐户的名称。
-
若要查看 Batch 凭据,请选择“