使用 Amazon SageMaker 构建机器学习应用
全程部署视频看这里,原视频30分钟左右为了观看体验剪掉了等待时间:
小白使用Amazon SageMaker 构建机器学习应用
一、创建Sagemaker Notebook实例
Amazon SageMaker: https://aws.amazon.com/cn/sagemaker/
输入名称、选择实例类型、配置磁盘大小,具体如下图
创建新角色,选择任意S3存储桶,点击创建角色
配置VPC网络,选择VPC、子网和安全组,并点击创建笔记本实例
等待5-6分钟,状态变为inSerice,点击打开jupyter
新建文件,如下图
二、下载数据集
输入如下代码,下载数据集并解压:
!wget -N https://archive.ics.uci.edu/ml/machine-learning-databases/00222/bank-additional.zip
!unzip -o bank-additional.zip
粘贴代码后点击运行
通过pandas展示数据集
使用 bank-additional-full.csv 数据集文件,将其通过 pandas 读入并展示:
import numpy as np # For matrix operations and numerical processing
import pandas as pd # For munging tabular data
import os
data = pd.read_csv("./bank-additional/bank-additional-full.csv", sep=";")
pd.set_option("display.max_columns", 500) # Make sure we can see all of the columns
pd.set_option("display.max_rows", 50) # Keep the output on one page
data
特征解释如下:
三、数据预处理
数据清洗将分类类型数据通过独热编码转换为数字。
data["no_previous_contact"] = np.where(
data["pdays"] == 999, 1, 0
) # Indicator vari