机器学习概念
我们把讨论的范围限定在最常见的有监督学习的框架内,所谓的机器学习模型,本质上是一个函数,其作用是实现从一个样本 x 到样本的标记值 Y 的映射,即 f(x) --> Y
。
当然这样说太笼统了,事实上机器学习模型需要在给定样本集合 { x_i |i=1,...,n}
以及其对应标签 <Y_1, Y_2, ..., Y_n>
的情况下,用假设已知的函数形式 f'(x_i) --> Y_i
, 尽可能拟合客观存在的映射函数f(x_i)--> Y_i
,并且保证f'
在未知同分布样本上具有尽可能相近的拟合能力。
AWS 公开数据
大家如果感兴趣平时想找些数据集自己玩的话,也可以看一下这个网站:
https://registry.opendata.aws/
机器学习工作流是迭代且负责的
Amazon SageMaker Studio
使用 Amazon SageMaker Studio
Amazon SageMaker Autopilot
使用 Amazon SageMaker Autopilot,创建并审查回归和分类模型
Amazon SageMaker 帮助您构建、训练和部署模型
Amazon SageMaker Ground Truth(仅限Global Region)
成功的模型需要高质量数据(仅限Global Region)
Amazon SageMaker Ground Truth工作原理(仅限Global Region)
Amazon SageMaker Processing
Amazon SageMaker Notebooks
Amazon SageMaker Notebooks 共享工作
自动捕获代码依赖项
内置算法
AWS Marketplace
成百上千种算法、模型和数据
一键式训练模型
自动模型调优
Experiments
Experiments 跟踪和管理数千个实验
Debugger
识别问题 – 例如梯度消失
全托管 SageMaker – 一键式模型部署
持续监控 Monitor
识别模型偏移
训练一次,多处运行,性能提升高达2倍
推理阶段的费用占90%
Elastic Inference 降低深度学习推理成本
Augmented AI 轻松构建人工审核预测所需的工作流
Amazon Augmented AI 的工作原理
编排框架
SageMaker 入门
Amazon SageMaker
Reference Architecture
国内应用