自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

晚风中的自由

漫无目的地徜徉在晚风中就像穿越神奇的河回到过去

08月 07月 06月 05月 03月

转载 Spark 自定义累加变量(Accmulator)AccumulatorParam

1、创建一个累加变量public <T> Accumulator<T> accumulator(T initialValue, AccumulatorParam<T> param)Create an Accumulator variable of a given type, which tasks can "add" values to using the += method. Only the drive

2020-06-21 19:40:56 772

转载 SparkJavaAPI例子

1、join 的使用将一组数据转化为RDD后，分别创造出两个PairRDD，然后再对两个PairRDD进行归约（即合并相同Key对应的Value），元素集合1: {(1, 1), (2, 4), (3, 9), (4, 16), (5, 25)}元素集合2: {(1, A), (2, D), (3, I), (4, P), (5, Y)}集合1和集合2进行join:{(1, (1, A)), (2, (4, D)), (3, (9, I)), (4, (16, P)), (5, (25.

2020-06-20 21:12:39 512

转载 SparkConf和SparkContext

任何Spark程序都是SparkContext开始的，SparkContext的初始化需要一个SparkConf对象，SparkConf包含了Spark集群配置的各种参数。初始化后，就可以使用SparkContext对象所包含的各种方法来创建和操作RDD和共享变量。Scala： 1 2 3 4 valconf=newSparkConf().setMaster("master").setAppName("appName") val...

2020-06-13 19:28:41 2716 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

晚风中的自由 CSDN认证博客专家 CSDN认证企业博客

码龄11年

IP 属地：广东省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

106: 原创

6万+: 周排名

78万+: 总排名

16万+: 访问

: 等级

2215: 积分

23: 粉丝

72: 获赞

12: 评论

187: 收藏

私信

关注

热门文章

分类专栏

工具 1篇
redis 1篇
Spark 24篇
Oracle 1篇
SpringCloud
阿里云 1篇
Scala 1篇
算法题目 1篇
Java 9篇
Hadoop 3篇
Hive
HBase
Storm 16篇
大数据 41篇
Linux 10篇

最新评论

Mac安装Eclipse
2301_76876359: 为什么eclipse installer 那个打不开啊
SparkConf和SparkContext
m0_64592586: 写的真好，收获不小，感谢大佬（这句话怎么这么像水军呢哈哈哈，好吧是真的感谢，对我挺有帮助的）
Filezilla for mac 安装和连接虚拟机
夕颜不是洗衣液: 简单有用的干货，支持！！！
VMWare Fusion 导入已有的虚拟机
agrhjjy: 把整个目录移动过来了 vmdk文件还是灰色无法选中，有大神知道原因吗
【Spark】指定Hadoop版本进行编译Spark
破喉咙12138: 不用管Scala 版本么？

最新文章

提示

确定要删除当前文章？

取消删除