阿里云机器学习PAI介绍

机器学习大致可以分三类:

有监督学习:指每个样本都有对应的期望值,通过模型搭建,完成从输入的特征向量到目标值的映射,典型的例子是回归和分类问题,例如:逻辑回归、随机森林、决策树。

无监督学习:指在所有的样本中没有任何目标值,期望从数据本身发现一些潜在的规律,例如一些简单的聚类K-means、DBSCAN等。

增强学习:相对来说比较复杂,是指一个系统和外界环境不断交互,获得外界反馈,然后决定自身的行为,达到长期目标的最优化。其中典型的案例就是Alpha Go围棋,或者无人驾驶。

阿里云机器学习平台是构建在阿里云是构建在阿里云Maxcompute计算平台之上,集数据处理,建模,离线预测,在线预测为一体的机器学习平台。阿里云机器学习封装了阿里巴巴集团内成熟的算法,向机器学习用户提供了更简易的操作体验。

该智能平台主要分为三层:

第一层:web UI界层;

第二层:机器学习算法层;

第三层:Maxcompute平台层。

Web UI界面主要由下区域组成:

主要功能区:展示了个各组件名称

画布区:使用者可以用鼠标相应的组件拖拉到画布上,形成一个有向的工作流,完成从数据到数据处理,再到建模等一系列的数据挖掘工作。

属性区:该区域可以设置组建内参数的信息。

阿里云机器学习的基础架构:

基础设施层:CPU计算集群

计算框架层:包括MaxReduce,SQL,MPI等计算方式,分布式计算框架主要执行并行化计算分发任务。

机器学习PAI的优点:1.算法丰富  2.深度学习(GPU)  3.可视化操作界面

4.一站式服务 

同时,PAI的深度学习支持算法框架:1.Tensorflow  2.Caffe  3.MXNet

在机器学习平台上完成以下基本任务:

  1. 开通机器学习服务

  2. 数据准备

  3. 数据预处理

  4. 数据可视化

  5. 算法建模

  6. 模型评估

其中数据准备阶段,机器学习平台底层支持两种数据源,一种是MaxCompute存储数据,另一种是OSS存储数据。

注意:使用MaxCompute作为存储,建议当数据小于20MB时使用机器学习IDE环境上传,当数据大于20MB时使用命令行工具上传。

  1. 开通机器学习PAI,并且创建项目,开通时注意自己选择的地域。

2.数据准备,进入机器学习平台,单击数据源,创建表。

IDE端上传数据到Maxcompute

OSS上传数据创建新空白数据

3. 数据准备完成后,单击组件,在工具和数据预处理文件夹下将SQL脚本、类型转换、归一化组件拖到画布中,并拼接成如下实验。

4. 数据可视化

5. 在机器学习->二分类文件夹下,将逻辑回归二分类组件拖入画布。

在右侧的字段设置页签,将目标列设置为ifhealth,训练特征列选择除目标列以外的全部列,并拼接运行,如下图所示。


6.模型评估

在机器学习->评估文件夹下,将二分类评估组件拖入画布。在画布右侧的字段设置页签,将原始标签列列名设置为ifhealth,并连接对应的组件流和数据流。

单击运行。完成后右键单击二分类评估组件,选择查看评估报告,单击图表页签,得到不同参数下训练的LR模型的ROC曲线,如下图所示。


喜欢记得来一个

“哪吒头”—玩转小潮流

  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

人工智能与算法学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值