在spark的rdd编程的时候,我们经常想做一些表连接的操作。
对rdd理解不深的时候我们可能会写出如下代码:
val temp1 = sc.textFile("C://Users/802/Desktop/1.txt").map(_.split(",")).map(k =>
(k(0).toInt,k(1).toInt))
val temp2 = sc.textFile("C://Users/802/Desktop/2.txt").map(_.split(",")).map(k =>
(k(0).toInt,k(1).toInt))
val temp4 = temp1.flatMap(k => {
var temp = List[(Int,Int,Double)]
temp2.foreach(i =>{
if(