消息拉取采用单线程形式,便于消息的顺序拉取
默认批量取32个,出现性能考虑,减少网络请求。不能保证会拉取到32个,因为消息队列中的存放的是topic-queueid对应的索引,会包含多个tag,而消息消费时根据tag来过滤。
消息基于tag过滤时,在broker端会根据tagscode(tag的哈希值)作一次过滤 ,而在cosummer端作过滤是为了解决tag哈希冲突。
消息拉取完后,将消息放到并发消息消费线程池来处理,消息拉取线程继续下一轮拉取请求。
并发消息消费会出现重复消息情况:
(1)在新增加集群结点时,会触发一次重平衡,队列分配到新增结点,原结点消费完数据,但是消费偏移没有即时上传到broker(上传消费偏移是周期线程触发)
(2)在没有新增结点时,有多个消费端,如果processQueue中的消息,其偏移量分别为(10,20,30),消费线程a处理偏移10,线程b处理偏移20,线程c处理偏移30,如果线程b,c处理的快,线程a处理得比较慢,因为并发消息消费在处理消费时,更新消费偏移是以processQueue中的最小偏移来更新,此时触发上传消息偏移,此时broker记录的消息偏移是10,结点重启,消息偏移以broker端的为准,会导致20,30重新消费。