摘要:面对淘宝的海量用户如何进行高效的关系构建?Graphx是否能在Spark一栈式数据解决方案中胜任至关重要的图计算一角?开发时如何提升性能?计算的结果如何高效应用?
2014年4月19日“中国Spark技术峰会”(Spark Summit China 2014)将在北京召开,国内外Apache Spark社区成员和企业用户将首次齐聚北京。AMPLab、Databricks、Intel、淘宝、网易等公司的Spark贡献者及一线开发者将分享他们在生产环境中的Spark项目经验和最佳实践方案。
面对淘宝的海量用户以及如何基于亿级别的用户和十亿级别的关系链进行高效的关系构建,社区发现和属性传播,一个高效强大的分布式图计算引擎必不可少。初出茅庐的Graphx是否能够担当如此重任,在Spark一栈式数据解决方案的蓝图中,胜任至关重要的图计算一角?开发时如何提升性能?计算的结果如何高效应用?本演讲将带给你满意的答案。在Spark技术峰会召开前夕,记者和本次Spark峰会的演讲嘉宾明风做了一次简单的沟通,他表示这些内容将会在4月19日“中国Spark技术峰会”和大家分享!点击报名!
@明风Andy
淘宝技术部数据挖掘与计算团队负责人,带领团队构建了国内第一个100台规模的Spark on Yarn集群,并基于Spark进行大量机器学习、实时计算和图计算的先行尝试,并将实践成果快速应用于淘宝网数据相关的业务和产品。