累加器 accumulator是Spark中提供的一种分布式的变量机制,其原理类似于mapreduce,即分布式的改变,然后聚合这些改变。 广播变量 广播变量是在每一个机器上缓存一份,不可变、只读的、相同的变量,该节点每个任务都能访问,起到节省资源和优化的作用。它通常用来高效的分发较大的对象。