大数据面经
文章平均质量分 94
针对网络资源中的面经进行学习,非本人面经
cluse_ld
这个作者很懒,什么都没留下…
展开
-
网络资源面经2
Kafka 原理,数据怎么平分到消费者 生产者分区 消费者分区 Flume HDFS Sink 小文件处理 Flink 与 Spark Streaming 的差异,具体效果 Spark 背压机制具体实现原理 Yarn 调度策略 Spark Streaming消费方式及区别 Zookeeper 怎么避免脑裂,什么是脑裂 讲一讲什么是 CAP 法则?Zookeeper 符合了这个法则的哪两个?原创 2023-03-02 17:42:58 · 371 阅读 · 0 评论 -
携程面经1
HDFS的写入流程?如果一台机器宕机,HDFS怎么保证数据的一致性?如果只存活一台机器又会发生什么情况?NameNode HA的实现原理?如何避免NameNode脑裂的情况?如果数据量比较大,如何解决NameNode 的内存瓶颈?MapReduce Shuffle中Reduce是怎么获得Map输出的分区文件,Map主动推还是Reduce主动拉?Kafka如何实现顺序消费?Spark Streaming消费Kafka的两种方式比较。如何提高Spark Streaming消费Kafka的并行度?原创 2023-02-28 21:00:38 · 378 阅读 · 1 评论