点一下关注吧!!!非常感谢!!持续更新!!!

目前已经更新到了:

  • Hadoop(已更完)
  • HDFS(已更完)
  • MapReduce(已更完)
  • Hive(已更完)
  • Flume(已更完)
  • Sqoop(已更完)
  • Zookeeper(已更完)
  • HBase(已更完)
  • Redis (已更完)
  • Kafka(正在更新…)

章节内容

上一节我们完成了如下的内容:
现实业务中我们会遇到:当Kafka集群中有一个节点宕机了,比如Broker0、Broker1中,Broker1宕机了,此时由于我们配置了副本数为2,Kafka集群正常工作,提供生产和消费能力。
但是当我们修好Broker1之后,恢复宕机之后,发现Leader都是Broker0,不会再平衡到Broker1上,所以我们需要用脚本来让Kafka集群进行自动再平衡。

  • Kafka自动再平衡
  • 新建主题
  • 查看主题
  • 模拟宕机
  • 重启节点
  • 编写JSON
  • 测试运行

大数据-66 Kafka 高级特性 分区 副本因子修改 replicas动态修改_hadoop

修改分区副本

现实业务中与实际项目中,我们可能由于主题的副本因子设置问题,需要重新设置副本因子。
由于集群的扩展,需要重新设置副本因子。
Topic一旦使用又不能轻易删除重建,因此动态增加副本因子就成为最终的选择。

背景情况

假设我们有两个KafkaBroker分别为:Broker0、Broker1

  • 当我们创建Topic有2个分区,并且replication-factor为1,基本一个Broker一个分区。
  • 当一个分区宕机了,该Topic就无法使用了,因为两个分区中只有一个可以使用
  • 当我们创建的Topic有3个分区时,replication-factor为2时,可能分区数据分布情况是:[broker0,partition0,partition1,partition2] 和 [broker1,partition1,partition0,partition2]
  • 每个分区有一个副本,当其中一个Broker宕机了,Kafka集群还能完整的凑出该Topic的两个分区,例如当Broker0宕机了,可以通过Broker1组合出Topic的两个分区。

启动服务

确保你有两台节点是可以正常使用的:
我这里是h121和h122

kafka-server-start.sh /opt/servers/kafka_2.12-2.7.2/config/server.properties
  • 1.

h121

大数据-66 Kafka 高级特性 分区 副本因子修改 replicas动态修改_分布式_02

h122

大数据-66 Kafka 高级特性 分区 副本因子修改 replicas动态修改_架构_03

创建主题

kafka-topics.sh --zookeeper h121.wzk.icu:2181 --create --topic topic_test_02 --partitions 3 --replication-factor 1
  • 1.

运行结果如下图:

大数据-66 Kafka 高级特性 分区 副本因子修改 replicas动态修改_架构_04

查看主题

kafka-topics.sh --zookeeper h121.wzk.icu:2181 --describe --topic topic_test_02
  • 1.

运行结果如下图:

大数据-66 Kafka 高级特性 分区 副本因子修改 replicas动态修改_架构_05


可以看到跟我们的上一个实验的开头分配情况是一致的。

修改副本因子(不允许)

尝试修改

# 刚才 --create的时候 --replication-factor是1
kafka-topics.sh --zookeeper h121.wzk.icu:2181 --alter --topic topic_test_02 --replication-factor 2
  • 1.
  • 2.

我们可以观察到,是不允许我们这样操作的:

大数据-66 Kafka 高级特性 分区 副本因子修改 replicas动态修改_hadoop_06

那如果我们业务上要求我们修改副本因子,我们该怎么办呢?
下面提供一个可行的方案。

修改副本因子

编写JSON

所以我们需要借助 kafka-reassign-partitions.sh
新建一个文件,这里的JSON在replicase里写入了多个:

vim topic_test_02_increment-replication-factor.json

{
  "versions": "1",
  "partitions": [
    {
      "topic": "topic_test_02", "partition": 0, "replicas": [0,1]
    }, 
    {
      "topic": "topic_test_02", "partition": 1, "replicas": [0,1]
    },
    {
      "topic": "topic_test_02", "partition": 2, "replicas": [1,0]
    }
  ]
}
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.

我们写入的内容如下:

大数据-66 Kafka 高级特性 分区 副本因子修改 replicas动态修改_kafka_07

执行JSON

kafka-reassign-partitions.sh --zookeeper h121.wzk.icu:2181 --reassignment-json-file topic_test_02_increment-replication-factor.json --execute
  • 1.

观察执行的结果如下:

大数据-66 Kafka 高级特性 分区 副本因子修改 replicas动态修改_分布式_08

查看结果

kafka-topics.sh --zookeeper h121.wzk.icu:2181 --describe --topic topic_test_02
  • 1.

执行的结果如下图所示:

大数据-66 Kafka 高级特性 分区 副本因子修改 replicas动态修改_分布式_09


可以看到,我们的副本数已经是 01、01、10了,此时就算 h121 或者 h122 中有一台节点挂掉了,我们也可以继续进行消费!