一些上一篇文章的补充信息:
关于微软Azure ML平台的迁移问题
ML 工作室(经典):迁移到 Azure 机器学习 - Azure Machine Learning | Microsoft Docs
完整的微软Learning信息
然后这篇文章,会涉及到运用Azure ML平台中的Automated ML和Designer,两个最主要的功能,当然这个平台的其中的Notebook功能也是很不错的,可以做一些python代码的实操,后续也会提到,那咱们话不多说开始!
首先review一下上一篇文章,我们成功建立了Azure Portal平台的ML资源(如果尚未成功,那就需要用双币卡注册一下Azure账号领取一个月的免费试用,不然后续操作是无法进行的),以及在Azure ML建立了一个Compute instance。最后,我们导入的很多看起来乱七八糟的文件,不管怎么说,都是有用的,成功导入即可!
OK那我们现在要做的,就会用到刚刚提到的文件。相信学过ML的同学,应该知道机器学习的步骤,那么首先我们第一步就是需要一个数据集,在这里我们选择一个糖尿病的数据集,也是一个机器学习非常经典的数据集。
在上一步里面的导入文件可以找到diabete.csv,可以看到里面的数据量和标签都是非常丰富的。
我们需要将这个.csv文件下载到桌面上:
然后回到我们test2下面的导航,选择AML,进入里面可以看到:
新建一个AML job,然后按照以下参数去运行
首先是导入数据集,我们需要从local file里面导入,我是把刚刚下载的diabete.csv存在桌面。
这些步骤根据默认来就好,最后点击create创建,就成功啦!这里的核心步骤的是确认文件的路径已经观察一下导入的csv格式是否恰当,没有问题接着往下走!
成功导入的文件如上图所示,下一步我们需要做一些参数的设置,以及我们想要研究哪个标签:
这里安装教程网站的参数填写就ok。
当然在这里依然可以选择新建一个compute instance,因为我第一次建立过了,不过很有意思的是existing instance我并没有找到我刚刚建立的compute instance,所以这个问题留给大家哈哈哈,不过印象里我第一次跑这个实例是没有遇到这个问题的,不过无伤大雅,我们继续
在下一步,我们将要选择我们想完成的task,这里小细节比较多,大家需要多注意,我也会一步一步讲:
首先是选择这个classification的选项,然后在这个选项下面有一个Enable deep learning的选项,根据这个上面的解释是说可以提高运行效率,提升得分,既然原文未提到这个是否需要,那我们不妨尝试一下选中。
在这里我们需要选择逻辑回归和随机森林的模型选项
以及一些选项:
最终点击finish:
~~~~~
大约10分钟的时间,结果就跑出来啦~
当然特别提一嘴,这个有个小提示因为我们选取了随机森林和逻辑回归两个模型去跑,但是最终只得到随机森林,原因在于我们选择一个阈值0.90,这也就说明逻辑回归的结果可能没有0.90以上,所以在这里就有一个warning的提示
本文到此为止啦,希望有帮助的话可以点个赞,有问题和指导欢迎各位老师不吝赐教!
Design的part在下一篇~