Kafka

最新推荐文章于 2023-09-05 18:41:12 发布

大数据盼盼

最新推荐文章于 2023-09-05 18:41:12 发布

阅读量162

点赞数

文章标签： kafka 分布式数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_66455465/article/details/130220086

版权

1.Kafka 架构

生产者、Broker、消费者、Zookeeper；

注意：Zookeeper 中保存 Broker id 和消费者 offsets 等信息，但是没有生产者信息。

2.Kafka 的机器数量

Kafka 机器数量 = 2 *（峰值生产速度 * 副本数 / 100）+ 1

3. 副本数设定

一般我们设置成 2 个或 3 个，很多企业设置为 2 个。

副本的优势：提高可靠性；副本劣势：增加了网络 IO 传输

4.Kafka 压测

Kafka 官方自带压力测试脚本（kafka-consumer-perf-test.sh、 kafka-producer-perf-test.sh ）。 Kafka 压测时，可以查看到哪个地方出现了瓶颈（CPU ，内存，网络 IO ）。一般都是网络 IO 达到瓶颈。

5.Kafka 日志保存时间

默认保存 7 天；生产环境建议 3 天

6.Kafka 中数据量计算

每天总数据量 100g ，每天产生 1 亿条日志， 10000 万 /24/60/60=1150 条 / 每秒钟

平均每秒钟：1150 条

低谷每秒钟：50 条

高峰每秒钟：1150 条 * （

2-20 倍） = 2300 条 - 23000 条

每条日志大小：0.5k - 2k （取 1k ）

每秒多少数据量：2.0M - 20MB

7.Kafka 的硬盘大小

每天的数据量 100g * 2 个副本 * 3 天 / 70%

8.Kafka 监控

公司自己开发的监控器；

开源的监控器：KafkaManager 、 KafkaMonitor 、 KafkaEagle

9.Kakfa 分区数

1）创建一个只有 1 个分区的 topic

2）测试这个 topic 的 producer 吞吐量和 consumer 吞吐量。

3）假设他们的值分别是 Tp 和 Tc ，单位可以是 MB/s 。

4）然后假设总的目标吞吐量是 Tt ，那么分区数 =Tt / min （ Tp ， Tc ）

例如：producer 吞吐量 = 20m/s ； consumer 吞吐量 = 50m/s ，期望吞吐量 100m/s ；

分区数 = 100 / 20 = 5 分区

分区数一般设置为：3-10 个

10.多少个 Topic

通常情况：多少个日志类型就多少个 Topic 。也有对日志类型进行合并的。

11.Kafka 的 ISR 副本同步队列

ISR（In-Sync Replicas），副本同步队列。 ISR 中包括 L

最低0.47元/天解锁文章

大数据盼盼

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Kafka

会根据 seq 重新添加到队列的合适位置，并把 max.in.flight.requests.per.connection 设为。情况下 max.in.flight.requests.per.connection。replica.lag.time.max.ms= 600000# 如果网络不好。败，就会无限次重试，保证数据必须成功的发送给两个副本，如果做不到，就不停。的重试，除非是面向金融级的场景，面向企业大客户，或者是广告计费，跟钱的计。官网有数据表明，同样的磁盘，顺序写能到。
复制链接

扫一扫

大数据盼盼 CSDN认证博客专家 CSDN认证企业博客

码龄3年

31: 原创

130万+: 周排名

6万+: 总排名

8851: 访问

: 等级

334: 积分

36: 粉丝

14: 获赞

2: 评论

14: 收藏

私信

关注

热门文章

分类专栏

SparkSql 1篇

最新评论

Hbase特点
CSDN-Ada助手: 很棒的博客，对Hbase的特点进行了简洁明了的介绍。希望你能够继续写出更多关于Hbase的优劣分析和使用技巧，让读者更好地了解和使用这个强大的数据库。另外，补充一下Hbase的数据模型和架构设计也是一个很好的扩展方向。加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434
Hbase的写逻辑
CSDN-Ada助手: 恭喜您写出了关于Hbase写逻辑的精彩博客！不仅内容深入浅出、逻辑清晰，而且对读者的帮助非常大。希望您继续保持创作的热情，为我们带来更多有价值的文章。接下来，建议您可以探讨一下Hbase在大数据场景下的应用案例或者是结合实际场景来分析一下Hbase的性能优化。期待您的下一篇博客！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148 看奖励名单。
Hbase 架构各个角色的功能以及使用场景
CSDN-Ada助手: 非常感谢用户的分享，这篇博客对于理解 Hbase 架构各个角色的功能以及使用场景非常有帮助。很高兴看到用户持续创作，希望能够继续分享更多关于 Hbase 的知识和经验，让更多人受益。建议下一步可以深入探讨 Hbase 的性能优化和实战经验，期待用户的精彩发表。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=ada，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。