StarRocks集群重启后服务服务卡在初始化起不来原因
- 问题背景
博主的StarRocks生产集群部署在虚拟机中,三台虚拟机,FE、BE混合部署,随着业务使用增加,CPU和内存资源不够,所以停机扩容,但是在扩容完成重启集群后发现StarRocks集群FE、BE都写入不了CFS上的文件。StarRocks的FE、BE数据目录都是存储在CFS上
- 问题现象
jstack检查JVM,一直卡在某个启动类中,原因是FE进程写入fe.pid文件失败
- 问题原因
CFS挂载参数问题,导致StarRocks无法写入CFS。未重启前,虚拟机挂载参数为,不影响StarRocks读写CFS
sudo mount -t nfs -o vers=3,nolock,proto=tcp,noresvport IP:/folder /localfolder
但是重启机器后,配置文件/etc/fstab中挂载参数却为
IP:/folder /localfolder nfs defaults 0 0
导致StarRocks无法写入CFS,服务一直处于初始化阶段
- 原因分析
StarRocks 依赖文件锁保证元数据安全,nolock缺失会默认启用 NFS 服务端锁,而StarRocks读写文件时会锁定文件,锁机制的配置不当导致启动失败
1520

被折叠的 条评论
为什么被折叠?



