Kafka Producer 工作流程
消息发送流程
Kafka Producer 发送消息的两种方式:同步发送、异步发送。
同步发送的流程图
异步发送流程图
发送流程说明(以异步发送为例):
- 客户端创建Producer对象:创建该对象时,同时会创建EventHandler、ProducerPool对象。其中ProducerPool中保存对象SyncProducer对象,其初始个数由broker.size确定,该对象与Kafka Broker相连,负责消息的发送。
- Producer对象调用send方法时,消息被放到阻塞队列。
- Send Thread 从队列里取出消息,并根据消息的partkey计算出消息应该发送到的分片。
- Send Thread根据分片信息去ProducerPool中找到对应的SyncProducer对象,发送消息。
Producer的Message Delivery
默认情况下request.required.acks = 0
,Producer 只发送,并不保证消息发送成功,类似于HTTP,所以可能会丢消息。
消息的确认模式:
0:不保证消息的到达确认,只管发送,低延迟但是会出现消息的丢失
1:发送消息,并会等待leader 收到确认后,一定的可靠性
-1:发送消息,等待leader收到确认,并进行复制操作后,才返回,最高的可靠性。
所以,默认情况下,Producer 支持的是at most once , 可以将request.required.acks设置为-1,使其支持at least once .
Producer的平滑扩容机制
从上文我们了解到,在创建Producer时使用的配置属性列表中,并没有zookeeper的连接信息,当我们动态增加Broker后,Producer短是如何平滑扩容的呢?
在创建Produer对象时,需要指定 broker地址(部分broker的地址即可)。 客户端会根据这个地址,定时(topic.metadata.refresh.interval.ms来设置)去取Broker的topic、partition、replicas等元数据信息。
当发现有新的borker时,客户端会创建一个新的SyncProduer对象连接到该broker,并将该对象放到ProducerPool中,等待发送消息,这样Producer端就支持了Broker动态的增减。
生产者定时更新topic元信息的时间间隔 ,若是设置为0,那么会在每个消息发送后都去更新数据
topic.metadata.refresh.interval.ms = 600 * 1000