RDD.collect的操作
collect操作,在最后的ResultTask.runTask中,执行的function的操作为下面代码.
由于对ResultTask的runTask这个函数的返回值就是这个runTask函数在执行完成RDD传入的function后的返回值.这里要说明下如果task的结果超过了spark.driver.maxResultSize配置的最大值时,默认是1G,直接对task的结果进行丢掉,不处理,
def
collect操作,在最后的ResultTask.runTask中,执行的function的操作为下面代码.
由于对ResultTask的runTask这个函数的返回值就是这个runTask函数在执行完成RDD传入的function后的返回值.这里要说明下如果task的结果超过了spark.driver.maxResultSize配置的最大值时,默认是1G,直接对task的结果进行丢掉,不处理,
def