![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 92
TRX1024
字节内推,可私信~
展开
-
一文看懂Spark中reduceByKey 和 groupByKey 的区别
目录一、先看结论二、举例、画图说明1.实现的功能分别是什么?1).groupByKey 实现 WordCount2).reduceByKey 实现 WordCount2.画图解析两种实现方式的区别1) groupByKey 实现 WordCount2).reduceByKey 实现 WordCount(简单流程)3).reduceByKey 实现 WordCount(终极流程)一、先看结论1.从Shuffle的角度 reduceByKey 和 g...原创 2021-09-04 21:08:53 · 14349 阅读 · 4 评论 -
大数据经典学习路线
1.Linux基础和分布式集群技术学完此阶段可掌握的核心能力:熟练使用Linux,熟练安装Linux上的软件,了解熟悉负载均衡、高可靠等集群相关概念,搭建互联网高并发、高可靠的服务架构;学完此阶段可解决的现实问题:搭建负载均衡、高可靠的服务器集群,可以增大网站的并发访问量,保证服务不间断地对外服务;学完此阶段可拥有的市场价值:具备初级程序员必要具备的Linux服务器运维能力。1.内容...原创 2018-11-29 12:16:16 · 233 阅读 · 0 评论 -
大数据的75个名词解释
近日,Ramesh Dontha 在 DataConomy 上连发两篇文章,扼要而全面地介绍了关于大数据的 75 个核心术语,这不仅是大数据初学者很好的入门资料,对于高阶从业人员也可以起到查漏补缺的作用。本文分为上篇(25 个术语)和下篇(50 个术语)。机器之心对文章进行了编译。上篇(25 个术语)如果你刚接触大数据,你可能会觉得这个领域很难以理解,无从下手。不过,你可以从下面这份包含了 ...转载 2019-03-29 11:10:02 · 4426 阅读 · 0 评论