之前在杭州培训的时候有接触过PAI,说实话是挺好用的。
直接接入ODPS数据,使用ODPS的引擎做机器学习,训练模型,体验还是不错的,基本的算法都有,满足基本预测挖掘数据的要求。
一个完整的建模步骤包括以下6个步骤:
step1:数据准备
step2:数据预处理
step3:数据可视化
step4:算法建模
step5:多模型评估
step6:数据存储
PAI全部可以完成上述步骤,就我测试来说,得到的模型效果不错。
然而,以上说的都是公网版本的PAI…
到了现在私有云的开发,PAI完全没办法干活,配合阿里PAI那边的技术人员,先是修复了跑不起来的情况,然后各种调参数,最终还是没跑起来,原因以下几点:
1.ODPS对应PAI的版本过低,造成各种参数不支持,毕竟PAI还是基于ODPS的;
2.PAI本身版本过低,造成很多公有云上有的组件,私有云上没有,诸如选项卡这类处理非数值型的组件没有。
然后就OVER了,只能自己默默建模,计算…
详情见下一篇,评分模型建立…