Spark的累加器（Accumulator）的使用要点

最新推荐文章于 2022-10-02 15:47:43 发布

jikuibu

最新推荐文章于 2022-10-02 15:47:43 发布

阅读量579

点赞数

分类专栏： spark 文章标签： spark累加器

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/leeyisong/article/details/84585614

版权

spark 专栏收录该内容

0 篇文章 0 订阅

订阅专栏

1、累加器的创建

在驱动器节点中，调用 SparkContext.accumulator(initialValue) 方法，创建出存有初始值的累加器。返回值为 org.apache.spark.Accumulator[T] 对象，其中 T 是初始值initialValue 的类型。

2、累加器值的累加

对于工作节点来说，只能对累加器进行累加值操作，比如python或者scala语言中，可以使用累加器的+=操作来进行。

3、工作节点无法读取累加器的值，从任务的角度看，累加器是一个只写变量。只有驱动器节点可以读取。

4、重要提醒，也是本文存在的意义

问题：鉴于task可能因为各种原因导致被重复执行，因此，转化操作的代码中对累加器进行值累加，可能并不能保证只执行一次，这就会产生问题。

解决：如果要确保每个任务只对累加器累加一次，那么必须把累加器放在foreach这样的行动操作中。

建议：在转化操作中，累加器通常只用于调试目的，不要用于实际的业务执行数判断。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark的累加器（Accumulator）的使用要点

1、累加器的创建在驱动器节点中，调用 SparkContext.accumulator(initialValue) 方法，创建出存有初始值的累加器。返回值为 org.apache.spark.Accumulator[T] 对象，其中 T 是初始值initialValue 的类型。2、累加器值的累加对于工作节点来说，只能对累加器进行累加值操作，比如python或者sc...
复制链接

扫一扫

专栏目录

jikuibu CSDN认证博客专家 CSDN认证企业博客

码龄9年

32: 原创

8万+: 周排名

33万+: 总排名

5万+: 访问

: 等级

908: 积分

11: 粉丝

34: 获赞

7: 评论

95: 收藏

私信

关注

热门文章

分类专栏

最新评论

endernewton/tf-faster-rcnn项目研究之一：项目部署（GPU版）
huiye丶666: ③tensorboard --logdir=tensorboard/vgg16/voc_2007_trainval/ --port=7001 & 会出现终端给出的网址，在浏览器打不开的问题命令改为tensorboard --logdir=tensorboard/vgg16/voc_2007_trainval/default --host=本地ip，再次尝试，即可打开。本地ip怎么查：ifconfig（我所说的补充全部位于ubuntu系统下）
endernewton/tf-faster-rcnn项目研究之一：项目部署（GPU版）
huiye丶666: 补充：①coco/PythonAPI 在make前一定要补上 python setup.py install，然后再make ②使用预训练resnet101模型测试时报错（要在运行前先改正，运行了报错以后再改正之后程序就要走if else 的else了，和源代码想走的if是不一样的）错误： ~/xxx/tf-faster-rcnn/lib/datasets/voc_eval.py line122,in voc_eval pickle.dump(recs,f) TypeError: writh() argument must be str,not bytes 原因：python 以r（读）方式open文件时，python2默认是二进制读，但是到了python3，如果还用r，则会报错，改为rb（b的意思是以二进制方式读）；同理，写也是一样的。改正方法：打开tf-faster-rcnn/lib/datasets/voc_eval.py 找到line122，没记错的话，第121行那个open里面只有r，把它改为rb
endernewton/tf-faster-rcnn项目研究之三：项目的代码结构及网络原理
胖胖大海: “通过ground truth标定框与anchor之间的差异（就是两个框中心点、宽、高的差值）来回归学习，从而使得rpn层的权重参数得到逐步调整，进而使得anchor与ground truth标定框逼近重合”。个人理解，在bounding box边框回归中，应该是将ground truth与anchor之间的差异作为监督信号，reg分支预测结果和anchor之间的差异作为被监督信号，训练目的是使预测结果逐渐逼近ground truth,anchor的坐标从头至尾应该都是不变的，参照论文公式（1）、（2）
endernewton/tf-faster-rcnn项目研究之一：项目部署（GPU版）
smileaqing: 您好，请问您尝试过不使用预训练的权重从头训练这个网络过吗？
endernewton/tf-faster-rcnn项目研究之一：项目部署（GPU版）
大雷哥～回复 zx741330608: 老哥能发个源码吗，我有点问题，695455266@qq.comqq.com

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。