2014 Spark美国峰会上几大顶级数据商精彩PPT分享

http://www.csdn.net/article/2014-07-03/2820516/1

2014 Spark美国峰会上几大顶级数据商精彩PPT分享

发表于 2014-07-03 17:317155次阅读| 来源 CSDN21 条评论| 作者 魏伟
allowtransparency="true" frameborder="0" scrolling="no" src="http://hits.sinajs.cn/A1/weiboshare.html?url=http%3A%2F%2Fwww.csdn.net%2Farticle%2F2014-07-03%2F2820516%2F1&type=3&count=&appkey=&title=2014%E5%B9%B4Spark%20Summit%E4%BA%8E6%E6%9C%8830%E6%97%A5%E8%87%B37%E6%9C%882%E6%97%A5%E5%9C%A8%E7%BE%8E%E5%9B%BD%E6%97%A7%E9%87%91%E5%B1%B1%E4%B8%BE%E8%A1%8C%E3%80%82%E6%9D%A5%E8%87%AA%E4%BD%BF%E7%94%A8Spark%E7%9A%84%E4%B8%80%E7%BA%BF%E6%8A%80%E6%9C%AF%E5%85%AC%E5%8F%B8%E5%8F%8A%E4%B8%93%E5%AE%B6%E6%B1%87%E8%81%9A%E4%B8%80%E5%A0%82%EF%BC%8C%E5%85%B1%E5%90%8C%E6%8E%A2%E8%AE%A8%E7%9B%AE%E5%89%8DSpark%E5%9C%A8%E4%BC%81%E4%B8%9A%E7%9A%84%E8%90%BD%E5%9C%B0%E6%83%85%E5%86%B5%E5%8F%8A%E6%9C%AA%E6%9D%A5Spark%E7%9A%84%E5%8F%91%E5%B1%95%E6%96%B9%E5%90%91%E5%92%8C%E9%81%AD%E9%81%87%E7%9A%84%E6%8C%91%E6%88%98%EF%BC%8C%E6%88%91%E4%BB%AC%E6%B1%87%E6%80%BB%E4%B8%80%E4%BA%9B%E7%B2%BE%E5%BD%A9PPT%E5%88%86%E4%BA%AB%E7%BB%99%E5%A4%A7%E5%AE%B6%E3%80%82&pic=&ralateUid=&language=zh_cn&rnd=1404876959255" width="22" height="16"> 摘要:2014年Spark Summit于6月30日至7月2日在美国旧金山举行。来自使用Spark的一线技术公司及专家汇聚一堂,共同探讨目前Spark在企业的落地情况及未来Spark的发展方向和遭遇的挑战,我们汇总一些精彩PPT分享给大家。

2014年Spark Summit于6月30日至7月2日在美国旧金山举行。Spark、Shark以及相关项目的主要用户聚集一地,共同探讨Spark项目开发方向以及实践经验。

Spark是一个基于内存计算的开源的集群计算系统,目的是让数据分析更加快速。Spark非常小巧玲珑,由加州伯克利大学AMP实验室的Matei为主的小团队所开发。使用的语言是Scala,项目的核心部分的代码只有63个Scala文件,非常短小精悍。 Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,它们使 Spark 在某些工作负载方面表现得更加优,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。


免费订阅“CSDN云计算”微信公众号,实时掌握第一手云中消息!

CSDN作为国内最专业的云计算服务平台,提供云计算、大数据、虚拟化、数据中心、OpenStack、CloudStack、Hadoop、Spark、机器学习、智能算法等相关云计算观点,云计算技术,云计算平台,云计算实践,云计算产业资讯等服务。


尽管创建 Spark 是为了支持分布式数据集上的迭代作业,但是实际上它是对 Hadoop 的补充,可以在 Hadoop 文件系统中并行运行。通过名为Mesos的第三方集群框架可以支持此行为。目前 50 +公司正在为这个项目贡献代码,每年的Spark 峰会都是我们学习大数据知识的绝好的机会,这里有来自UC伯克利以及一些使用Spark的著名公司,比如Databricks、Cloudera 、  MapR、DataStax等。Spark Summit一共三天,第一天、第二天是一些主题演讲,第三天是Databricks提供的Spark培训。我们精选了一些精彩的PPT分享给大家。

1. Databricks公司联合创始人兼现任CTO Matei Zaharia: Spark在大数据生态系统中的地位 

Matei Zaharia是加州大学伯克利分校AMP实验室博士研究生,Databricks公司的联合创始人兼现任CTO。Zaharia致力于大规模数据密集型计算的系统和算法。研究项目包括:Spark、Shark、Multi-Resource Fairness、MapReduce Scheduling、SNAP Sequence Aligner,这次spark 峰会上他主要就 Spark的现状和未来做了详细的阐述。

height="500" width="100%" scrolling="no" src="http://share.csdn.net/frame/5739" frameborder="0" allowfullscreen=""> 

2. 加州大学伯克利AMP实验室主任Mike Franklin:Berkeley数据分析的未来

Mike Franklin是加州大学伯克利AMP实验室主任, AMPLab是Berkeley Data Analytics Stack (BDAS)和Spark的发源地,作为BDAS的核心组件,获得了24家顶尖的IT公司的支持。在这次演讲中,我将分享伯克利未来BDAS的研究方向以及目前正在进行的一些研究项目,如机器学习、数据和模型服务。

height="500" width="100%" scrolling="no" src="http://share.csdn.net/frame/5755" frameborder="0" allowfullscreen=""> 

3.DataStax工程执行副总裁  Martin Van Ryswyk:Spark 和 Cassandra

Apache Cassandra是领先的分布式数据库,能够满足世界上成千上万对可伸缩性和可用性最为苛刻的网站需求。这个演讲简要概述Cassandra,以及目前DataStax及DataStax合作伙伴的状态,另外还将分享两家使用Spark和Cassandra成功经验的例子。  height="400" width="100%" scrolling="no" src="http://share.csdn.net/frame/5740" frameborder="0" allowfullscreen="">

4. Cloudera 联合创始人兼首席战略官Mike Olson:Apache Spark在企业数据分析的作用

Mike Olson是Cloudera 的联合创始人,并担任首席执行管直到2013年,然后开始了他的首席战略官生涯。主要负责Cloudera的产品策略、开源的领导以及与用户的对接。Mike还在Oracle公司担任过2年的嵌入式技术副总裁。此次峰会上他主要就Spark在企业中的作用以及Cloudera和Intel的合作做了相关解读。

height="400" width="100%" scrolling="no" src="http://share.csdn.net/frame/5751" frameborder="0" allowfullscreen="">

5. SAP平台战略实施副总裁Aiaz Kazi: 交付大数据的企业级架构

Aiaz Kazi是SAP公司的平台战略实施副总裁,他负责平台技术、商业策略、平台采用、新平台计划。他的工作主要围绕SAP HANA、SAP HANA云平台、SAP HANA市场以及所有SAP产品的投资组合,包括内存技术、移动、分析、用户体验、集成和应用程序开发。

height="400" width="100%" scrolling="no" src="http://share.csdn.net/frame/5750" frameborder="0" allowfullscreen="">

6.  Hortonworks CTO Eric Baldeschwieler:Spark和大数据应用程序的未来

Eric Baldeschwieler是专业大数据顾问。他是Hortonworks的创始CEO和后来的首席技术官。他创立并领导雅虎团队,将Apache Hadoop从原型发展到企业级技术,从而是Hadoop才有了如今的广泛使用。曾经他是雅虎和Inktomi网络搜索工程团队的领袖级人物。此次的演讲他主要分析了为什么Spark是最好的选择以及它为什么会是当下应用程序更好的平台。 

height="500" width="100%" scrolling="no" src="http://share.csdn.net/frame/5749" frameborder="0" allowfullscreen=""> 

7. Conviva联合创始人 Ion Stoica:Apache Spark与 Databricks

Ion Stoica是UC Berkeley计算机教授,Conviva共同创始人,目前是Databricks的CEO。弹性P2P协议Chord、集群内存计算框架Spark、集群资源管理平台Mesos都出自他。这次在Spark峰会上的演讲主题是Databricks的发展以及Databricks云。 
height="500" width="100%" scrolling="no" src="http://share.csdn.net/frame/5761" frameborder="0" allowfullscreen="">

 8.  MapR 科技联合创始人兼CTO M.C. Srivas :Spark和Hadoop的集成

M.C. Srivas在Google搜索基础设施团队工作了2年,在2009年夏天他选择离开了Google,并创建了公司——MapR。MapR也采用了Google基础设施背后优秀的设计思想(Google GFS和MapReduce),并提供大数据处理的业务。他的演讲主要是关于MapR的数据平台架构和Hadoop和Spark如何集成并最终为终端用户提供最完美的体验。 

height="400" width="100%" scrolling="no" src="http://share.csdn.net/frame/5754" frameborder="0" allowfullscreen="" style="color: rgb(51, 51, 51); font-family: Helvetica, Tahoma, Arial, sans-serif; font-size: 14px; line-height: 24px; ">

9. Databricks创始人Patrick Wendell:Spark的未来

Databricks创始人Patrick Wendell:毕业于加州大学伯克利分校计算机科学系,专注于大规模数据密集型计算。致力于Spark的性能基准测试,同时是spark-perf的合著者。此次峰会他的演讲主题是“Spark的未来” 

height="500" width="100%" scrolling="no" src="http://share.csdn.net/frame/5741" frameborder="0" allowfullscreen="" style="color: rgb(51, 51, 51); font-family: Helvetica, Tahoma, Arial, sans-serif; font-size: 14px; line-height: 24px; ">

10. Cloudera公司数据科学家Sandy Ryza:Spark on YARN

Cloudera公司高级软件工程师及Hadoop提交者Sandy Ryza主要致力于云计算架构Hadoop(MapReduce和 YARN)的资源管理。还为大数据集和POC设计机器学习工具,同时建立Monte Carlo simulations 和 NLP pipelines。此次峰会上他的演讲主题是“Spark on YARN”          

height="500" width="100%" scrolling="no" src="http://share.csdn.net/frame/5738" frameborder="0" allowfullscreen="" style="color: rgb(51, 51, 51); font-family: Helvetica, Tahoma, Arial, sans-serif; font-size: 14px; line-height: 24px; ">

11. 雅虎实验室高级研究员Hirakendu Das:Spark MLLib上的分布式决策树 
height="500" width="100%" scrolling="no" src="http://share.csdn.net/frame/5734" frameborder="0" allowfullscreen="">

12. IBM硅谷实验室高级工程师Dimple Bhatia :IBM的在Apache Spark上的文本分析

height="500" width="100%" scrolling="no" src="http://share.csdn.net/frame/5732" frameborder="0" allowfullscreen="" style="color: rgb(51, 51, 51); font-family: Helvetica, Tahoma, Arial, sans-serif; font-size: 14px; line-height: 24px; ">



  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
简介之前罗嗦一句:以下内容版本归原作者,本来本着分享精神我不应该要这一分 的,但是我发现整理这些资源竟然整整花了我超过一个小时,而且原先地址的资源有 些不能下载,我是千方百计找到所有的ppt,做个合集方便大,节约大的时间吧, 以下正题! 2015 中国大数据技术大会已经圆满落幕,本届大会,以更加国际化的视野,从政 策法规、技术实践和产业应用等角度深入探讨大数据落地后的挑战,作为大数据产业 界、科技界与政府部门密切合作的重要平台,吸引了数千名大数据技术爱好者到场参 会。 以下为合集列表: 1. 启明星辰公司副总裁潘柱廷:2016 年大数据技术发展趋势解读 2. Databricks公司联合创始人、Spark首席架构师辛湜:Spark发展:回顾2015,展望 2016 3. 京东云平台总架构师、系统技术部负责人刘海锋 :从2014 到2016,大规模内存数 据库演进之路 4. Hulu 资深研发主管梁宇明 :Voidbox - Docker On YARN在Hulu的实践 5. Pivotal 研发总监姚延栋:开源大数据引擎:分布式Greenplum数据库内核分析 6. 阿里巴巴iDST语音组高级专鄢志杰 :Deep Learning助力客服小二:数据技术及 机器学习在客服中心的应用 7. 小米金融技术主管方流: 大数据在互联网金融中的应用 8. 新加坡管理大学信息系统学院教授朱飞达 :大数据与金融创新:从研究到实战 9. 宜信大数据创新中心首席数据科学项亮: 大数据在信用风险管理中的应用 10. 南京大学计算机系PASA大数据实验室教授黄宜华 :Octopus(大章鱼):基于R语 言的跨平台数据机器学习与数据分析系统 11. 百度基础架构部高级架构师沈国龙 :BML百度大规模机器学习云平台实践 12. 新浪微博算法技术总监姜贵彬:大数据驱动下的微博社会化推荐 13. FreeWheel技术副总裁李旸:FreeWheel基于大数据的新兴视频广告测量实践 14. 阿里巴巴数据安全部阿里数据安全小组总监郑斌:大数据下的数据安全 15. 数美公司联合创始人兼CTO梁堃:Sentry金融实时风控系统

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值