Spark
四、Spark算子:Java版本(map、flatMap、distinct、subtract、combineByKey等)
五、RDD算子:reduceByKey、foldByKey、SortByKey
六、Spark算子:groupByKey、cogroup、subtractByKey、join
七、Spark文件保存到本地或HDFS:saveAsTextFile和saveAsObjectFile
八、Spark RDD算子:分区操作,mapPartitions和mapPartitionsWIthIndex
九、Spark RDD算子:RDD分区,HashPartitioner、RangePartitioner、自定义分区
十一、Spark加载CSV和JSON文件(附在虚拟机中执行jar包)
十三、Spark SQL操作外部数据源(Parquet、Hive)
十五、Spark SQL:MySQL经典50题(SQL版和Spark版)
十八、Graph图的算子(subgraph、joinVertices、outerJoinVertices),PageRank算法