前言
在配置RocketMQ集群的时候,遇到了几个问题,让我百思不得其姐。还好在最后坚持不懈的努力排查bug下给他解决了。这篇文章主要记录一下解决的这个bug,同时也希望能帮助到各位正在学习RocketMQ的小伙伴儿们。
错误分析&&问题解决
在自己配置RocketMQ集群的时候,遇到了这些错误,错误代码如下:
java.io.FileNotFoundException: …/conf/broker.conf (没有那个文件或目录)
at java.io.FileInputStream.open0(Native Method)
at java.io.FileInputStream.open(FileInputStream.java:195)
at java.io.FileInputStream.<init>(FileInputStream.java:138)
at java.io.FileInputStream.<init>(FileInputStream.java:93)
at org.apache.rocketmq.broker.BrokerStartup.createBrokerController(BrokerStartup.java:128)
at org.apache.rocketmq.broker.BrokerStartup.main(BrokerStartup.java:58)
在启动nameserver的时候,发现nameserver可以正常启动,但是在启动broker的时候,直接就异常退出了。重启的办法也试过了,虽然重启能解决99%的问题,但是这配置上的问题还是无法解决。报错说没有找到那个文件或目录,那咱们就把broker.conf这个配置文件的路径给它写全了。
前面的文章介绍过…代表上一级目录,现在咱们干脆点,直接上一级目录也不用了,直接用完整的地址,我的broker.conf完整地址如下(加上启动broker的命令):
nohup ./mqbroker -c /usr/local/src/rocketmq-all-4.7.1-bin-release/conf/2m-2s-async/broker-a.properties & autoCreateTopicEnable=true
这样是解决了这个bug,但是问题又接踵而至。
因为虚拟报的错误实在是太多了,有点找不到这次启动报的错误在哪里,所以我们为了更好的排查错误,可以直接给所有的nohup.out干掉,方便我们重新启动nameserver和broker出错时重新生成这个文件。
接着又看到了这个错误,代码如下:
java.net.BindException: 地址已在使用
at sun.nio.ch.Net.bind0(Native Method)
at sun.nio.ch.Net.bind(Net.java:433)
at sun.nio.ch.Net.bind(Net.java:425)
at sun.nio.ch.ServerSocketChannelImpl.bind(ServerSocketChannelImpl.java:223)
at io.netty.channel.socket.nio.NioServerSocketChannel.doBind(NioServerSocketChannel.java:127)
at io.netty.channel.AbstractChannel$AbstractUnsafe.bind(AbstractChannel.java:501)
at io.netty.channel.DefaultChannelPipeline$HeadContext.bind(DefaultChannelPipeline.java:1218)
at io.netty.channel.AbstractChannelHandlerContext.invokeBind(AbstractChannelHandlerContext.java:506)
at io.netty.channel.AbstractChannelHandlerContext.bind(AbstractChannelHandlerContext.java:491)
at io.netty.channel.DefaultChannelPipeline.bind(DefaultChannelPipeline.java:965)
at io.netty.channel.AbstractChannel.bind(AbstractChannel.java:210)
at io.netty.bootstrap.AbstractBootstrap$2.run(AbstractBootstrap.java:353)
at io.netty.util.concurrent.SingleThreadEventExecutor.runAllTasks(SingleThreadEventExecutor.java:408)
at io.netty.channel.nio.NioEventLoop.run(NioEventLoop.java:455)
at io.netty.util.concurrent.SingleThreadEventExecutor$2.run(SingleThreadEventExecutor.java:140)
at java.lang.Thread.run(Thread.java:748)
接着我看到启动的broker不是我配置的那个服务器上的IP,是这个:
The broker[localhost.localdomain, 192.168.220.XXX:10911] boot success. serializeType=JSON and name server is 192.168.220.XXX:9876
真是越想越不对劲,多次检查了我的broker-a.properties下的nameserverADDR发现没有错误,并且检查/etc/profile文件下的虚拟坤IP发现也是正确的。
于是换了种思路,将自己新建的所有文件夹给delete掉了:
然后以上诉的方式重新启动,发现把这个删掉和删去nohup.out这招果然奏效!原因大概就是因为这两个虚拟机都是从另一台虚拟机上直接克隆过来的,配置文件没有清除干净。清理完成后:
nameserver和broker集群都可以正常启动了,确实有点神奇!
本篇文章到这里就结束了,希望能帮助到遇到这个问题的小伙伴儿们,感谢各位小伙伴们的支持!