共享变量分为两种:广播变量和累加器。
广播变量是分布式只读变量,用于分布式计算需要给集群中各个节点分发相同的变量副本。
累加器是在driver中定义的变量,用于独立计算单个节点executor上的数据(副本),并将结果送给driver端进行最终聚合。原理类似于mr
共享变量分为两种:广播变量和累加器。
广播变量是分布式只读变量,用于分布式计算需要给集群中各个节点分发相同的变量副本。
累加器是在driver中定义的变量,用于独立计算单个节点executor上的数据(副本),并将结果送给driver端进行最终聚合。原理类似于mr