开源机器学习工具SQLFlow

在北京QCon全球软件开发大会上,蚂蚁金服副CTO胡喜正式宣布开源机器学习工具 SQLFlow

SQLFlow抽象出端到端从数据到模型的研发过程,配合底层的引擎及自动优化,

具备基础SQL知识的技术人员即可完成大部分的机器学习模型训练及预测任务.

“机器学习”需要极为丰富的知识储备:

     1、高等数学、统计学、概率论以及编程等,

     2、需要他在其他领域保持非常高的知识水平,

从而这些苛刻的要求让很多技术人很难成为机器学习领域的专家,因此制约着整个人工智能产业的发展.

Github 上,蚂蚁金服提供了SQLFlow 的安装指引,以及快速入门

https://github.com/sql-machine-learning/sqlflow

训练模型

SELECT *
FROM iris.train  --从元数据表读数据
TRAIN DNNClassifier --选择 DNN 分类器
WITH n_classes = 3, hidden_units = [10, 20] --设置分类数(训练数据是三分类)和 hidden layer
COLUMN sepal_length, sepal_width, petal_length, petal_width  --选择加入训练的数据列
LABEL iris.train.class --选择标注的 label 列
INTO sqlflow_models.my_dnn_model;  --保存模型	

用训练好的模型预测一组数据的 label

SELECT *
FROM iris.test  --从待预测的数据表读数据( sepal_length, sepal_width, petal_length, petal_width 有数据,但 label 为空)
PREDICT iris.predict.class --待填充的 label 数据列
USING sqlflow_models.my_dnn_model; --选择已训练好的模型

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值