(12)使用数据分区优化join
数据分区
设计RDD的Partitioner
(11)数据分区
优化并行度
数据分区
优化并行度
数据分区
(10)KeyValue对RDDs(二)
(10)KeyValue对RDDs(二)
(9)KeyValue对RDDs(一)
KeyValue对RDDs介绍
创建KeyValue对RDDs
KeyValue对RDDs的操作
(8)RDDs的特性
RDDs的血统关系图
RDDs的延迟计算
RDD.persist()
(6)RDDs基本操作之Transformations
Transformations介绍
逐元素transformations
集合运算
(5)RDDs介绍
RDDs介绍
RDDs的创建方法
Scala的基础知识
(4)Spark程序的开发和运行
创建SparkContext
WordCount程序
(3)Spark开发环境搭建
使用Scala+IntelliJ IDEA+Sbt搭建开发环境
(2)Spark基础知识
Spark下载
Spark的Shells
Spark的核心概念
(1)Spark简介
从bigdatastudy.cn下载的讲义
Apache Hadoop YARN.pdf完整电子版
Apache Hadoop YARN.pdf完整电子版
perl-base_5.14.2-6ubuntu2.4_amd64
mysql安装时候遇到依赖问题,这是需要的包。
详情见:
http://blog.csdn.net/maixia24/article/details/43410093
hadoop-eclipse-plugin-1.2.1.jar
hadoop eclipse 插件,编译环境 hadoop1.2.1+
eclipse 版本 Version: Kepler Service Release 1
在我的ubuntu下亲测可用
advanced rest client json文件
advanced rest client 需要加载的json文件