Kafka 是互联网行业内常用的一个消息中间,和RabbitMQ、RocketMQ的作用都是解耦生产端和消费端,缓存消息。
优点:
- 高吞吐,低延迟(零拷贝)
- 可扩展性
- 持久性,可靠性(磁盘持久化)
- 容错性(副本)
- 高并发
Kafka是怎么保证端到端之间的消息一致性的呢?
每一个环节都会可能导致数据丢失或者重复。
1. 生产者
生产者的职责就是,确保生产的消息能到达Kafka,这里一般可以通过ack机制(kafka中的参数)来确定消息是否到达kafka中。
1.1 ack
该参数表示有多少个分区副本收到消息,才认为本次发送是成功的。
- acks=0,只要发送消息就认为成功,生产端不等待服务器节点的响应(
生产上一般不采用这种,很容易导致数据丢失
) - acks=1,表示生产者收到 leader 分区的响应就认为发送成功
- acks=-1,只有当 ISR 中的副本全部收到消息时,生产端才会认为是成功的。这种配置是最安全的,但由于同步的节点较多,吞吐量会降低。
ISR:i