![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
八股系列
文章平均质量分 95
大大大大肉包
一个喜欢计算机的帅小伙
展开
-
八股系列 Flink
数据已时间为单位分为一个个批次,通过RDD进行分布式计算,是面向流的处理框架,是真正的流式计算。原创 2024-06-14 16:52:11 · 671 阅读 · 0 评论 -
八股文系列Spark
两者并没有大的差别。都是将 mapper(Spark 里是 ShuffleMapTask)的输出进行 partition,不同的 partition 送到不同的 reducer(Spark 里 reducer 可能是下一个 stage 里的 ShuffleMapTask,也可能是 ResultTask)。Reducer 以内存作缓冲区,边 shuffle 边 aggregate 数据,等到数据 aggregate 好以后进行 reduce(Spark 里可能是后续的一系列操作)。原创 2024-06-11 16:56:00 · 1057 阅读 · 1 评论 -
八股系列 Hadoop
Hadoop3相对于Hadoop2在方面都得到了显著的提升。原创 2023-04-28 17:22:42 · 1590 阅读 · 0 评论 -
八股文系列Redis
缓存穿透是指查询⼀个在缓存和数据库中都不存在的数据。由于缓存没有这个数据,所以每次查询都会“穿透缓存直接查询数据库,如果有⼤量此类查询,会给数据库带来极⼤的压⼒。原创 2024-06-06 09:58:52 · 1061 阅读 · 1 评论