更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps。
本讲义出自Josef Habdank在Spark Summit EU上的演讲,主要介绍了对于大规模数据科学的整体模型方法,基于DataBricks的每天几十亿行数据的机器学习模型系统架构,以及基于Spark Streaming的并行训练模型,分享了基于SparkML整体模型的对于机票价格的预测服务。