- 博客(2)
- 收藏
- 关注
原创 Spark实践项目4:Spark基本概念
Spark基本概念 RDD——Resillient Distributed Dataset A Fault-Tolerant Abstraction for In-Memory Cluster Computing弹性分布式数据集。Operation——作用于RDD的各种操作分为transformation和action。Job——作业,一个JOB包含多个RDD及作用于相应RDD上的各种ope
2016-08-07 16:33:30 513
原创 Spark实践项目3:Spark运行模式及原理
一、运行模式概述 本节部分内容源自官方文档:http://spark.apache.org/docs/latest/cluster-overview.html (一)Spark运行模式列表 目前最为常用的Spark运行模式有: - local[N]: 本地模式,使用N个线程。本地线程方式运行,主要用于开发调试Spark应用程序 - Standalone:利用Spark自
2016-08-07 16:32:33 1965
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人