Azure完成一个二分类实验
工作需要,这两天调研了一下机器学习平台,尝试使用了微软的Azure机器学习平台。
Google ML / Amazon ML /Microsoft Azure 三个平台的对比分析参考
Azure使用步骤
参考博客:https://blog.csdn.net/zhangjing199402/article/details/81298269
- 创建实验
右下角创建一个新的实验,上方的红框可以给实验命名(可以不唯一)。
- 选择/上传数据集
这里选择的是一个关于收入的二分类数据集。可以进行数据集的可视化:
点击数据框下方的圈圈,选择Visualize——
数据可视化:
- 清理缺失数据
这里选择的是直接删除有缺失数据的样本,还可以自定义值替换缺失值等。
- 选择数据中需要的列作为feature
从左侧拖动【Select Columns in Dataset】模块到框内,并于上一个框连接(忘记截图了,可以直接看下一个步骤的图),在本模块的右侧设置选择的列作为分类的feature,注意,作为label的列也要选进去:
- 划分训练集和测试集比例
可以在右侧设置训练集和测试集的比例。
- 选择模型(可选一个或两个对比)
点击模型模块,可以在右侧调参。
- 配置模型的数据和label
【Split Data】模块的左输出点为训练数据,右输出点为测试数据,将数据和模型通过箭头与【Train Model】模块相连,点击【Train Model】模块,可在右侧选择一列作为label。
- 模型运行和评估
添加【Score Model】模块和【Evaluate Model】模块(注意输入流的箭头连接),然后点击下方的run
如题,全部显示绿色的勾则表示模型成功运行,点击【Evaluate Model】下方的圆圈可以对结果进行可视化查看: