- 博客(1)
- 资源 (7)
- 问答 (1)
- 收藏
- 关注
翻译 Spark初探-搭建
Spark 1.用于集群上的计算框架,海量数据处理。 2.不使用MapReduce作为执行引擎。使用自己的分布式运行时。 3.与MapReduce在接口和运行时方面一致。 可与Hadoop高度集成。可运行在YARN上使用Hadoop file 格式和存储终端上比如HDFS 特点:可以保存大量数据集在内存中供多个jobs使用。使得性能(在数量和其它更多方面)比MapReduce(数据集从磁盘上加载...
2018-08-01 21:32:42 863
【Spark】最佳实践
陈欢
腾讯资深程序员,15年编码经验,曾任职网络安全、互联网金融等部门,亲手从零建设了财付通业务的Spark集群,并使之同时支持SQL、实时计算、机器学习等多种数据计算场景。他目前就职于腾讯社交与效果广告部,从事大数据分析工作。
林世飞
腾讯资深研究员,2005年加入腾讯,先后在无线产品、安全中心、搜索平台、开放平台、社交与效果广告部等部门从事开发和团队管理工作。他对网络安全、搜索引擎、数据挖掘、机器学习有一定了解,热衷知识传播和分享,曾获腾讯学院2009年年度优秀讲师。目前,他就职于社交与效果广告部,负责广告系统相关的研发工作。
2019-01-06
android 从页面顶部滑出选择框 如何实现
2012-03-09
TA创建的收藏夹 TA关注的收藏夹
TA关注的人