五、Kafka高频面试题

本文详细介绍了Kafka的架构、副本设定、日志保存时间、数据量计算、监控、分区策略、消息丢失与重复、消费能力不足的解决办法以及参数优化等方面,涵盖了Kafka在大数据环境中的关键知识点和实战经验。
摘要由CSDN通过智能技术生成

1、Kafka架构

         生产者、Broker、消费者、ZK;

        注意:Zookeeper中保存Broker id和消费者offsets等信息,但是没有生产者信息。

 

 2、Kafka的机器数量

         Kafka机器数量 = 2 *(峰值生产速度 * 副本数 / 100)+ 1

3、副本数设定

        一般我们设置成2个或3个,很多企业设置为2个

        副本的优势:提高可靠性;副本劣势:增加了网络IO传输

4、Kafka压测

        Kafka官方自带压力测试脚本(kafka-consumer-perf-test.sh、kafka-producer-perf-test.sh)。Kafka压测时,可以查看到哪个地方出现了瓶颈(CPU,内存,网络IO)。一般都是网络IO达到瓶颈

5、Kafka日志保存时间

        默认保存7天;生产环境建议3天

6、Kafka中数据量计算

        每天总数据量100g,每天产生1亿日志, 10000万/24/60/60=1150条/秒钟

        平均每秒钟:1150

        低谷每钟:50

        高峰每秒钟:1150条*(2-20=2300条-23000条

        每条日志大小0.5k-2k(取1k

        每秒多少数据量&#

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值