如果消息吞吐量在每秒几万条以下,数据消费不要求严格的准确性和顺序性,那么优先考虑rabbitmq。
1、消息分发规则
rabbitmq可以根据routing_key/header等等方式进行规则匹配将消息发送至对应消费者
kafka需要自己把通道内消息都取出来,自己写消费规则
2、延时消息
rabbitmq有官方的 rabbitmq delayed message exchange 处理延时消息
kafka没有官方的延时消息
3、消息的保持
rabbitmq无法保持已消费的消息,但是3.9版本以后也利用stream实现消息被反复消费以及从之前某一特定时间点读取消息。
kafka消息会被持久化一个专门的日志文件里。不会因为被消费了就被删除。
4、消息的错误处理
rabbitmq会跳过错误的消息继续消费,对于数据准确性不那么严格的数据是有利的。
kafka不允许消息空洞,不管是 Kafka 自身消息格式的损坏,还是消费者处理出现异常,是不允许跳过消费失败的消息继续往后消费的,这个有利于处理需要严格准确的消息消费。
5、顺序消费
rabbitmq单线程理论是顺序消费,但当一个线程消费消息报错的时候,RabbitMQ 会把消费失败的消息再入队,此时就可能出现乱序。
kafka通过offset这种位移值来标记消费情况,只要partition中消息是顺序的,那么正确配置消费者就可以顺序消费。
6、消息的吞吐量
RabbitMQ 的吞吐量是每秒几万条
Kafka 的吞吐量是每秒几十万条