Kafka消息处理与集群维护

最新推荐文章于 2024-09-15 08:18:46 发布

Garry1115

最新推荐文章于 2024-09-15 08:18:46 发布

阅读量1.9k

点赞数 1

分类专栏： kafka 文章标签： kafka 消息处理集群维护

本文链接：https://blog.csdn.net/zwx19921215/article/details/61628347

版权

kafka 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

磁盘重认识

当需要从磁盘读取数据时，要确定读的数据在哪个磁道，哪个扇区：

首先必须找到柱面，即磁头需要移动对准相应磁道，这个过程叫做寻道，所耗费时间叫做寻道时间;
然后目标扇区旋转到磁头下,这个过程耗费的时间叫做旋转时间；

一次访盘请求（读/写）完成过程由三个动作组成

寻道（时间）：磁头移动定位到指定磁道;
旋转延迟（时间）：等待指定扇区从磁头下旋转经过；
数据传输（时间）：数据在磁盘、内存与网络之间的实际传输

由于存储介质的特性，磁盘本身存取就比主存慢，再加上机械运动耗费，磁盘的存取速度往往是主存的几百分之一甚至几千分支一

怎么样才能提高磁盘的读写效率呢？

根据数据的局部性原理，有以下两种方法

预读或者提前读;
合并写——多个逻辑上的写操作合并成一个大的物理写操作中；

即采用磁盘顺序读写(不需要寻道时间，只需很少的旋转时间)。实验结果：在一个6 7200rpm SATA RAID-5 的磁盘阵列上线性写的速度大概是300M/秒，但是随机写的速度只有50K/秒，两者相差将近10000倍。

RAID说明:

好处：能够将多块小磁盘合并为一块大磁盘，并且RAID-5允许一块磁盘挂掉，RAID-6允许2块磁盘挂掉

弊端：多块小磁盘的同时并发读写的效率远大于RAID单块大磁盘的读写效率

Kafka消息的写入原理

一般的将数据从文件传到套接字的路径：

操作系统将数据从磁盘读到内核空间的页缓存中；
应用将数据从内核空间读到用户空间的缓存中；
应用将数据写回内存空间的套接字缓存中
操作系统将数据从套接字缓存写到网卡缓存中，以便将数据经网络发出；

这样做明显是低效的，这里有四次拷贝，两次系统调用。如果使用sendfile(Java 为: FileChannel.transferTo api)，两次拷贝可以被避免：允许操作系统将数据直接从页缓存发送到网络上。优化后，只有最后一步将数据拷贝到网卡缓存中是需要的

Kafka
topic信息

[root@localhost zhangwx]# kafka-topics.sh --describe --zookeeper localhost:12181 --topic test
Topic:test	PartitionCount:1	ReplicationFactor:1	Configs:
	Topic: test	Partition: 0	Leader: 1	Replicas: 1	Isr: 1

说明：

PartitionCount:1	//表示分区数量为1
ReplicationFactor:3	//表示每个分区的副本数为3
Configs:
	Topic: my-replicated-topic	Partition: 0	//表示一个分区的分区编号为0
Leader: 0	//表示分区leader为broker0级 即第一台机器
Replicas: 2,0,1	//表示副本所在的机器为broker2,broker0,broker1三台机器上
Isr: 0,1,2 //处于同步中的broker，假设leader为broker0挂掉了，那么可以从isr中选举出其它机器作为leader

Kafka消息删除原理

从最久的日志段开始删除(按日志段为单位进行删除)，然后逐步向前推进，直到某个日志段不满足条件为止，删除条件（日志段表示一个个的.log日志文件）

满足给定条件predicate(配置项log.retention.{ms,minutes,hours}和log.retention.bytes指定)；
不能是当前激活日志段；(激活日志段表示正在操作的日志)
大小不能小于日志段的最小大小(配置项log.segment.bytes配置)
要删除的是否是所有日志段，如果是的话直接调用roll方法进行切分，因为Kafka至少要保留一个日志段；

Kafka消息检索原理

Kafka消息segment
file组成和物理结构

以读取offset=368776的message为例，需要通过下面2个步骤查找：

第一步查找segment file;

以上图为例,其中00000000000000000000.index表示最开始的文件，起始偏移量(offset)为0.第二个文件00000000000000368769.index的消息量起始偏移量为368770 = 368769 + 1。只要根据offset二分查找文件列表，就可以快速定位到具体文件。当offset=368776时定位到00000000000000368769.index|log

第二步通过segment file查找message；

算出368776-368770=6，取00000000000000368769.index文件第三项(6,1407)，得出从00000000000000368769.log文件头偏移1407字节读取一条消息即可

Kafka集群维护

集群信息实时查看(topic工具)：

列出集群当前所有可用的topic：

bin/kafka-topics.sh –list –zookeeper zookeeper_address

查看集群特定topic 信息：

bin/kafka-topics.sh –describe –zookeeper zookeeper_address

–topic topic_name

集群信息实时修改(topic工具)：

创建topic：

bin/kafka-topics.sh –create –zookeeper zookeeper_address –replication-factor 1 –partitions 1 –topic topic_name

增加(不能减少) partition(最后的4是增加后的值)：

（注：一般来说当数据量逐渐增多时，我们需要提高该topic的并发度，就可以通过增加partition的数量来提高）

bin/kafka-topics.sh –zookeeper zookeeper_address –alter –topic topic_name –partitions 4

Topic-level configuration 配置都能修改

Kafka集群leader平衡机制

每个partitiion的所有replicas叫做“assigned replicas”，“assigned replicas”中的第一个replicas叫“preferred replica”，刚创建的topic一般“preferred replica”是leader。下图中Partition 0的broker 2就是preferred replica”，默认会成为该分区的leader。

集群leader平衡：

bin/kafka-preferred-replica-election.sh –zookeeper zookeeper_address

auto.leader.rebalance.enable=true

集群分区日志迁移：

迁移topic数据到其他broker，请遵循下面四步：

写json文件,文件格式如下：

cat topics-to-move.json

{"topics": [{"topic": "foo1"},

            {"topic": "foo2"}],

 "version":1

}

使用–generate生成迁移计划（下面的操作是将topic: foo1和foo2移动到broker 5,6）:

bin/kafka-reassign-partitions.sh –zookeeper localhost:2181
–topics-to-move-json-file topics-to-move.json –broker-list “5,6” –generate

这一步只是生成计划，并没有执行数据迁移；

使用–execute执行计划：

bin/kafka-reassign-partitions.sh –zookeeper localhost:2181
–reassignment-json-file expand-cluster-reassignment.json –execute

执行前最好保存当前的分配情况，以防出错回滚使用–verify验证是否已经迁移完成

迁移某个topic的某些特定的partition数据到其他broker，步骤与上面一样，但是json文件如下面所示:

cat custom-reassignment.json

{“version”:1,”partitions”:[{“topic”:”foo1″,”partition”:0,”replicas”:[5,6]},{“topic”:”foo2″,”partition”:1,”replicas”:[2,3]}]}

可以指定到topic的分区编号

kafka-reassign-partitions.sh工具会复制磁盘上的日志文件，只有当完全复制完成，才会删除迁移前磁盘上的日志文件。执行分区日志迁移需要注意：

kafka-reassign-partitions.sh 工具的粒度只能到broker，不能到broker的目录(如果broker上面配置了多个目录，是按照磁盘上面已驻留的分区数来均匀分配的)，所以，如果topic之间的数据，或者topic的partition之间的数据本身就不均匀，很有可能造成磁盘数据的不均匀:

对于分区数据较多的分区迁移数据会花大量的时间，所以建议在topic数据量较少或磁盘有效数据较少的情况下执行数据迁移操作；

进行分区迁移时最好先保留一个分区在原来的磁盘，这样不会影响正常的消费和生产，如果目的是将分区5(brober1,5)迁移到borker2,3。可以先将5迁移到2,1，最后再迁移到2,3。而不是一次将1,5迁移到2,3。因为一次迁移所有的副本，无法正常消费和生产，部分迁移则可以正常消费和生产