前置条件
RocketMq client 4.9.7
RocketMq server 4.9.7
现象
在测试环境中,发现生产者往RocketMq发消息时,偶尔出现No topic route info in name server,
重新尝试发送又可以发送成功
问题分析 & 排查
1、由于是偶尔会出现发送失败的情况,怀疑RocketMq服务端资源不足,或者生产方资源不足导致消息发送异常,带着这个疑问,我先排查的是RocketMq服务端资源使用情况
我们RocketMq的部署架构是双主双从,下图可以看出服务端重启次数是0,并且资源远远没有达到瓶颈
第二点就是排查 生产方的资源使用情况,但是由于即使是闲时情况下,生产方也会出现发送失败的情况,因此判定不是生产方的资源问题
2、网络问题
生产方连接RocketMq服务中断,正常情况下,客户端与namesrv之间会保持一个长连接,通过netstat -at查看连接是否存在是,发现连接是一直存在的,因此网络问题这一点先暂不考虑
3、通过RocketMq client log日志查看,除了报错生产方自定义的topic信息不存在,还存在以下两个no topic route info报错,并且一直在刷报错日志
a. RMQ_SYS_TRACE_TOPIC
RMQ_SYS_TRACE_TOPIC:这个topic是broker开启消息跟踪之后,系统自动创建的
b.TBW182
这个topic是Broker启动时,当autoCreateTopicEnable的配置为true时,会自动创建该默认topic,当生产者发送消息的topic没有创建时,会先路由到这个默认的topic,然后再继承该topic的配置,创建新的topic
查阅GitHub上也有人提出相同的Issue
在4.4.0版本以上,如客户端开启了消息追踪开关,则broker也需要配置tracetopicEnable=true
查看代码中创建producer时,确实开启了traceMsg=true
尝试将broker添加traceTopicEnabled=true,重启broker
监控rocketmq client log日志,发现没有再出现报错信息
再次测试批量发送消息,没有再出现No topic route info ****** 报错
解决方案
将broker添加traceTopicEnabled=true
总结
客户端在开启消息追踪的情况下,服务端需要打开消息追踪开关traceTopicEnabled=true