php的kafka踩坑(二)

在PHP使用Kafka过程中遇到多消费者重复消费同一消息的困扰,发现是由于topic分区数为0导致。通过删除并重新创建具有正确分区数的topic解决问题。本文介绍了Kafka中的producer、consumer、topic、partition和group概念,以及如何实现负载均衡的多消费者队列。示例代码展示了如何在enqueue/rdkafka包下进行操作。
摘要由CSDN通过智能技术生成

接上一篇文章,上次没有解决的一个问题就是在做一个队列的时候,存在多消费者消费到同一个消息的情况,今天终于解决了这个问题,问题的本质是因为运维给我创建的topic是有问题的,他创建的分区数量是0,我今天上容器看了一下,终于发现了,然后删了自己重新建了一个,具体容器操作kafka的topic教程可以看我另一个文档基于kafka容器操作topic

在这里,我们从头开始介绍一下topic(主题),partition(分区),group(分组),consumer(消费者),producer(生产者)的关系

  • producer,生产者,生产数据
  • consumer,消费者,消费数据
  • topic,简单点说就是一个队列,生产者生产数据和消费者消费数据都必须指定一个Topic,就是生产的数据要放到哪个队列去给消费者消费
  • partition和group,一个topic可以配置多个partition,consumer消费数据时是按照group来消费的,kafka确保每个partition只能由同一个group中的同一个consumer消费,如果想要重复消费,那么需要其他的组来消费,所以同一个group的消费者数量应当小于等于partition数量。Zookeerper中保存这每个topic下的每个partition在每个group中消费的offset。(此段介绍引用这篇文章
    • consumer读取时,会指定读取的group,同一个消息在同一个group下只会读取到一次,如果要重复消费数据,需要新建group
    • 如果group只有一个,并且有多个partition,一个consumer时,所有partition里的消息都会发往该consumer,如果consumer不止一个时,可能会存在有的consumer里面数据消费的多,有的消费的少,做多消费者的队列就是用这个特性,当partition数量=consuerm时,消息可以达到负载均衡。

下面上一下下代码,修改之后topic的partition是3个,依旧是基于 enqueue/rdkafka 这个包

生产者,不指定partition,kafka会自动分配

$connFactory = new RdKafkaConnectionFactory([
    'global' => [
        'metadata.broker.list' => '127.0.0.1:9092',
        'socket.timeout.ms' => '50'
    ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值