kafka学习整理

kanwwan

已于 2024-01-24 11:52:56 修改

阅读量84

点赞数

分类专栏： Java 文章标签： kafka big data

于 2021-09-14 20:31:13 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wkk2620632/article/details/120295939

版权

Java 专栏收录该内容

37 篇文章 1 订阅

订阅专栏

kafka consumer group:

Kafka消费组(consumer group) - huxihx - 博客园

kafka partition group 讲的比较好的文章:

kafka partition（分区）与 group - 凌-风 - 博客园

Coordinator存储的信息

对于每个Consumer Group，Coordinator会存储以下信息：

对每个存在的topic，可以有多个消费组group订阅同一个topic(对应消息系统中的广播)
对每个Consumer Group，元数据如下:
订阅的topics列表
Consumer Group配置信息，包括session timeout等
组中每个Consumer的元数据。包括主机名，consumer id
每个正在消费的topic partition的当前offsets
Partition的ownership元数据，包括consumer消费的partitions映射关系;

kafka分区:

如果分区数大于消费者实例个数，按照抽屉原理，必定有一个消费者同时负责多个分区（2个 or 以上）

如果分区数等于消费者实例个数，正好一个消费者消费一个分区

如果分区数小于消费者实例个数，必然有消费者空闲

那么kafka的分区策略，

Range策略

RoundRobin策略

kafka 面试题:

Kafka常见面试题_徐周的博客-CSDN博客_kafka面试题

kafka缓存:

Kafka中大量使用了页缓存，这是Kafka实现高吞吐的重要因此之一。虽然消息都是先被写入页缓存，然后由操作系统负责具体的刷盘任务，但在Kafka中同样提供了同步刷盘及间断性强制刷盘（fsync）的功能，这些功能可以通过log.flush.interval.message、log.flush.interval.ms等参数来控制。同步刷盘可以提高消息的可行性，防止由于机器掉电等异常造成处于页缓存而没有及时写入磁盘的消息丢失。不过一般不建议这么做，刷盘任务就应交由操作系统去调配，消息的可靠性应该由多副本机制来保障，而不是由同步刷盘这种严重影响性能的行为来保障。

kafka快速的原因:

Cache Filesystem Cache PageCache缓存

顺序写由于现代的操作系统提供了预读和写技术，磁盘的顺序写大多数情况下比随机写内存还要快。

Zero-copy 零拷技术减少拷贝次数

Batching of Messages 批量量处理。合并小的请求，然后以流的方式进行交互，直顶网络上限。

Pull 拉模式使用拉模式进行消息的获取消费，与消费端处理能力相符。

kafka消息堆积解决方案:

kafka幂等的解决方案:

kafka部分失败部分成功如何处理:

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
kafka学习整理

kafka consumer group:Kafka消费组(consumer group) - huxihx - 博客园kafka partition group 讲的比较好的文章:kafka partition（分区）与 group - 凌-风 - 博客园
复制链接

扫一扫

专栏目录

kanwwan CSDN认证博客专家 CSDN认证企业博客

码龄14年

98: 原创

6万+: 周排名

4万+: 总排名

17万+: 访问

: 等级

2082: 积分

110: 粉丝

147: 获赞

20: 评论

266: 收藏

私信

关注

热门文章

分类专栏

笔记 7篇
dubbo 6篇
java基础 3篇
redis 2篇
技术管理及业务思考 1篇
供应链 4篇
职场人生 1篇
前端 1篇
markdown 1篇
docker 1篇
other
Java 37篇
openssl 3篇
文章 3篇
svn 1篇
git 1篇
设计模式 1篇
go 1篇
数据 2篇
python 3篇
物联网 5篇
IOT 4篇
leecode 1篇
sql 3篇
中间件

最新评论

linux 命令个人总结
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加除了各种控件外，文章正文的字数；(3)使用更多的站内链接。
elasticsearch 总结
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加除了各种控件外，文章正文的字数；(3)增加条理清晰的目录。
负载均衡总结
CSDN-Ada助手: 运维的工作内容是什么？有哪几种分类？
wifi配网方式
风清扬999: 感谢，搜藏了
wifi配网方式
画中有画: 个人觉得用声波进行wifi配网是目前最优的一种方案

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。