Spark 之 Stage划分、数据本地性算法实现
[ 睡着的水-hzjs-2016.08.22 ]
一、Stage划分算法
---1、Spark Application 中可以因为不同的Action触发众多的Job,也就是说一个Application 中可以有很多的Job,每个Job是有一个还或者多个Stage构成的,后面的Stage依赖前面的Stage,也就是说只有前面依赖的Stage计
[ 睡着的水-hzjs-2016.08.22 ]
一、Stage划分算法
---1、Spark Application 中可以因为不同的Action触发众多的Job,也就是说一个Application 中可以有很多的Job,每个Job是有一个还或者多个Stage构成的,后面的Stage依赖前面的Stage,也就是说只有前面依赖的Stage计