淘宝明风:基于Graphx的图计算实践分享

摘要:面对淘宝的海量用户如何进行高效的关系构建?Graphx是否能在Spark一栈式数据解决方案中胜任至关重要的图计算一角?开发时如何提升性能?计算的结果如何高效应用?

2014年4月19日“中国Spark技术峰会”(Spark Summit China 2014)将在北京召开,国内外Apache Spark社区成员和企业用户将首次齐聚北京。AMPLab、Databricks、Intel、淘宝、网易等公司的Spark贡献者及一线开发者将分享他们在生产环境中的Spark项目经验和最佳实践方案。


面对淘宝的海量用户以及如何基于亿级别的用户和十亿级别的关系链进行高效的关系构建,社区发现和属性传播,一个高效强大的分布式图计算引擎必不可少。初出茅庐的Graphx是否能够担当如此重任,在Spark一栈式数据解决方案的蓝图中,胜任至关重要的图计算一角?开发时如何提升性能?计算的结果如何高效应用?本演讲将带给你满意的答案。在Spark技术峰会召开前夕,记者和本次Spark峰会的演讲嘉宾明风做了一次简单的沟通,他表示这些内容将会在4月19日“中国Spark技术峰会”和大家分享!点击报名

@明风Andy

淘宝技术部数据挖掘与计算团队负责人,带领团队构建了国内第一个100台规模的Spark on Yarn集群,并基于Spark进行大量机器学习、实时计算和图计算的先行尝试,并将实践成果快速应用于淘宝网数据相关的业务和产品。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值