Amazon SageMaker Notebook 实例生命周期配置示例教程
1. 项目的目录结构及介绍
该项目的主要目录结构如下:
amazon-sagemaker-notebook-instance-lifecycle-config-samples/
├── add-pypi-repository
│ └── on-start.sh
├── auto-stop-idle
│ └── on-start.sh
├── connect-emr-cluster
│ └── on-start.sh
├── disable-uninstall-ssm-agent
│ └── on-start.sh
├── enable-fips-openssl-provider
│ └── on-start.sh
├── execute-notebook-on-startup
│ └── on-start.sh
└── README.md
目录介绍
- add-pypi-repository: 该目录包含一个脚本,用于添加私有 PyPi 仓库。
- auto-stop-idle: 该目录包含一个脚本,用于在笔记本空闲超过1小时后自动停止。
- connect-emr-cluster: 该目录包含一个脚本,用于将 EMR 集群连接到笔记本实例。
- disable-uninstall-ssm-agent: 该目录包含一个脚本,用于在启动时禁用和卸载 SSM 代理。
- enable-fips-openssl-provider: 该目录包含一个脚本,用于在每个 conda 环境中启用 OpenSSL FIPS 提供程序。
- execute-notebook-on-startup: 该目录包含一个脚本,用于在启动时执行笔记本文件。
- README.md: 项目的说明文档。
2. 项目的启动文件介绍
每个目录下的 on-start.sh
文件是启动时执行的脚本。以下是一些示例脚本的简要介绍:
add-pypi-repository/on-start.sh
该脚本用于添加私有 PyPi 仓库,以便在启动时安装特定的 Python 包。
auto-stop-idle/on-start.sh
该脚本用于在笔记本空闲超过1小时后自动停止实例,以节省资源。
connect-emr-cluster/on-start.sh
该脚本用于将 EMR 集群连接到笔记本实例,以便在笔记本中使用 SparkMagic 进行交互。
3. 项目的配置文件介绍
项目中的配置文件主要是 on-start.sh
脚本。这些脚本在创建或启动笔记本实例时执行,用于自定义实例的行为。
配置文件示例
以下是一个简单的 on-start.sh
脚本示例:
#!/bin/bash
# 安装特定版本的 Python 包
pip install my-package==1.0.0
# 设置环境变量
export MY_ENV_VAR="my_value"
配置文件的使用
在创建 Amazon SageMaker 笔记本实例时,可以将这些脚本附加到实例的生命周期配置中。具体步骤如下:
- 创建一个新的生命周期配置。
- 将
on-start.sh
脚本内容复制到生命周期配置的“启动脚本”部分。 - 创建或更新笔记本实例,并选择该生命周期配置。
通过这种方式,可以确保每次启动笔记本实例时都执行特定的自定义操作。
以上是关于 Amazon SageMaker Notebook 实例生命周期配置示例项目的详细介绍和使用教程。希望这些内容能帮助你更好地理解和使用该项目。