史上最全141道大数据面试题:Redis+Linux+kafka

这是一篇关于大数据面试的综合文章,涵盖了Redis、Linux和Kafka的相关问题。涉及Kafka的消息存储、消费者行为、数据传输事务、分区策略,以及Hadoop和Spark的相关知识点。此外,还包括了大数据的基础概念、优化和实际应用中的问题,如TOP K算法和海量数据处理。适合中高级Java开发者和大数据从业者复习与学习。
摘要由CSDN通过智能技术生成
  1. 数据传输的事物定义有哪三种?

  2. Kafka 判断一个节点是否还活着有那两个条件?

  3. producer 是否直接将数据发送到 broker 的 leader(主节点)?

  4. Kafa consumer 是否可以消费指定分区消息?

  5. Kafka 消息是采用 Pull 模式,还是 Push 模式?

  6. Kafka 存储在硬盘上的消息格式是什么?

  7. Kafka 高效文件存储设计特点

  8. Kafka 与传统消息系统之间有三个关键区别

  9. Kafka 创建 Topic 时如何将分区放置到不同的 Broker 中

  10. Kafka 新建的分区会在哪个目录下创建

  11. partition 的数据如何保存到硬盘

  12. kafka 的 ack 机制

  13. Kafka 的消费者如何消费数据

  14. 消费者负载均衡策略

  15. 数据有序

大数据面试题大全

========

1、kafka 的 message 包括哪些信息

2、怎么查看 kafka 的 offset

3、hadoop 的 shuffle 过程

4、spark 集群运算的模式

5、HDFS 读写数据的过程

6、RDD 中 reduceBykey 与 groupByKey 哪个性能好,为什么

7、spark2.0 的了解

8、 rdd 怎么分区宽依赖和窄依赖

9、spark streaming 读取 kafka 数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值