Spark
heheha_zj
大数据小菜鸟
展开
-
Spark的ReduceByKey和GroupByKey的区别
Spark的ReduceByKey和GroupByKey的区别 ReduceByKey和GroupByKey其实和Hadoop的MapReduce中的是否带有combinner一样的道理,无论是ReduceBuKey还是GroupByKey返回的结果都是RDD。 ReduceByKey:说白了就是带有Commbiner的操作,也就是说ReduceBykey会减少Map端的输出,在Map端输出的时候...原创 2020-01-31 16:24:19 · 330 阅读 · 0 评论 -
Maven设置指定jar包依赖版本信息
我们在配置Spark core 的 maven依赖的时候jackson-module-scala_2.11的版本冲突,解决办法如下: <dependencies> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.11</ar...原创 2019-12-12 16:44:07 · 9029 阅读 · 0 评论