kafka 面试题

3. kafka怎么保证exactly one(数据准确唯一)
只有ack = -1的时候才能保证exactly one

4 kafka 怎样设计partition 的数量
具体要看数据的吞吐量来决定,单kafka分区每秒的数据吞吐量为10M/s,假如有20M数据产生,就需要设计2-3个partition,这样才能保证和产生的数据量保持一致、

5 kafka的幂等性一个和多次写入的结果是一样的

6 kafka牺牲性能来换取稳定性,把数据落地到磁盘当中,每一个topic中的partition中的数据都是有序的,生产者或者消费者通过数据的行偏移量来读取,全局无序,但是在分区内是有序的

7 kafka会数据的偏移量存到哪里?
数据的偏移量存储在zookeeper中特殊的topic中

8 怎么保证数据不丢失?
对于生产者 可以通过配置保证消息的不丢失,通过配置kafka的ack机制的ack = -1 这样就可以保证producer在分区内所有的副本都得到同步,才会收到响应。
对于消费者来说,在消息处理完成之前jiu提交offset,就有可能造成数据丢失,我们可以关闭自动提交offset,处理完消息后手动提交。

9 数据积压问题

数据积压主要是两方面的问题,一方面是下游的数据拉取的速度小于产生数据的速度,我们可以通过提高批次的拉取量和拉取时间,使拉取的速度大于产生数据的速度,
另一方面是,消费者消费数据不及时,我们可以通过增加topic中的分区数量同时提高消费组的消费者的数量,使分区的数量=消费者的数量。

10 数据重复问题

启动数据的幂等性,默认是关闭的,同时要求ack = -1 且副本的数量>1

11 如何保证数据的有序性?
kafka只能保证消费者在消费一个分区时是有序的。kafka全局无序但是区内有序。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Kafka 面试题及答案可以包括以下内容: 1. Kafka 是什么?它的主要特点是什么? Kafka 是一个分布式流处理平台,主要用于处理实时数据流。它的主要特点包括高吞吐量、可扩展性、持久性、容错性和可靠性。 2. Kafka 的消息传递模型是什么? Kafka 的消息传递模型是基于发布-订阅模式的,生产者将消息发布到一个或多个主题(topic),而消费者则订阅这些主题并接收消息。 3. Kafka 的核心组件有哪些? Kafka 的核心组件包括生产者(Producer)、消费者(Consumer)、主题(Topic)、分区(Partition)和代理(Broker)。 4. Kafka 的消息是如何保证可靠性传递的? Kafka 通过将消息持久化到磁盘上的日志文件来保证可靠性传递。生产者将消息写入日志文件后即可返回成功,而消费者可以根据自己的需求灵活地消费消息。 5. Kafka 的数据复制机制是怎样的? Kafka 使用副本机制来实现数据的冗余备份。每个分区都有一个主副本和多个副本,主副本负责处理读写请求,而其他副本则用于备份和容错。 6. Kafka 的消息顺序性如何保证? Kafka 保证每个分区内的消息顺序性,即同一个分区内的消息按照发送的顺序进行存储和消费。不同分区之间的消息顺序性不能保证。 7. Kafka 的消费者如何处理消息的偏移量? Kafka 的消费者可以手动管理消息的偏移量,也可以使用消费者组(Consumer Group)来自动管理偏移量。消费者组可以协同工作,确保每个消息只被消费一次。 这些是一些常见的 Kafka 面试题及答案,希望对你有帮助!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值