transformation
*map(func)
*flatmap(func)
*union()
*groupByKey()
*reduceByKey()
*sortByKey()
*join()
*filter(func)
action
*count()
*reduce(func)
*collece()
*take()
*saveAsTextFile(path)
*
Persistence
*cache():将RDD缓存在memory中
*persist()
RDD依赖
宽依赖
子RDD依赖于所有父RDD
窄依赖
子RDD—-父RDD 1对1
RDD中shuffle
ByKey()
join() 会shuffle