一、mapToPair
将每一行的第一个单词作为键,1 作为value创建pairRDD
scala版本
scala没有mapToPair,使用map就能完成
val conf=new SparkConf().setMaster("local[2]").setAppName("maptopair")
val sc=new SparkContext(conf)
val lines=sc.textFile("D:/text/sample.txt")
val pairs = lines.map(x=>(x.split(" ")(0),1))
pairs.collect.foreach(println)
java版本
SparkConf conf=new SparkConf().setMaster