背景
近期有不少用户反馈说,SequoiaDB 集群刚部署时,可以通过 sdblist
工具查看当前机器的节点状态信息(如节点所属复制组ID,节点ID,所属组名等),但运行一段时间后,sdblist 工具就无法看到当前机器的节点信息。如下图所示。
笔者也曾遇到过这样的问题,重启节点后,sdblist 工具就可以正常显示节点信息。其背后的原因是 SequoiaDB 数据库节点在启动时,会在 /tmp/sequoiadb
目录生成对应的管道文件(为了避免管道文件被操作系统清理,SequoiaDB 3.x 及以上版本将管道文件存储在 /var/sequoiadb
)下,执行 sdblist
命令时会通过这些管道文件获取节点的状态信息。当这些管道文件被清理后,sdblist 命令将无法正常获取到节点的状态信息。至此,好奇的读者或许会跟笔者一样,在心里产生如下的疑问:
/tmp/sequoiadb
目录下的文件何时会被清理?- sdblist 工具的工作流程是怎样的?
/tmp 目录清理机制
Linux 系统在设计之初就考虑了多种机制来管理系统运行过程中产生的临时文件或者易变文件,其中 /tmp
目录的自动清理机制则是其中之一。不同的操作系统版本管理临时文件的实现方式也有所不同。笔者在此以 RedHat 7
为例进行说明,其他操作系统版本的清理机制请读者自行 google 或者找度娘 。
根据 RedHat 的官方说明,RedHat 7 使用 systemd
管理易变和临时文件,其中 systemd-tmpfiles
工具清理临时文件,该工具的配置信息可在以下三个地方进行查看和修改(优先级由高到低)
-
/etc/tmpfiles.d/*.conf
-
/run/tmpfiles.d/*.conf
-
/usr/lib/tmpfiles.d/*.conf
在 *.conf
配置文件中,每行对应一个路径, 详细的使用说明和格式请参考 tmpfile.d 介绍。因此,为了避免清理 /tmp/sequoiadb
目录下的文件,可在 /usr/lib/tmpfiles.d
目录下添加 sequoiadb.conf
文件,文件内容如下:
x /tmp/sequoiadb
sdblist 工作流程
在命令行中执行 sdblist -l
时,sdblist 会执行如下图所示的流程:
首先解析并校验运行参数的正确性,接着从 /proc
目录下找到符合节点名称(节点服务端口) 节点类型
或者 节点名称(节点服务端口)
格式的进程,如:sequoiadb(11810) S
,接着从进程名中获取节点节点名称,节点服务端口、节点类型信息以及对应进程号,接着通过节点服务端口和进程号从 /tmp/sequoiadb
目录下查找节点对应的管道文件(以 “sequoiiadb_engine_bw_节点服务端口_进程号” 格式命名), 接着通过管道文件与节点进行通信,获取节点的状态信息,如:所属组ID(GID),节点ID(NID),是否为主节点等。
因此,当 /tmp/sequoiadb
目录下的管道文件被删除后,sdblist
工具只能显示节点名称、节点服务端口、节点类型、节点对应的进程号,而不能正常显示节点的状态信息。
小结
在 SequoiaDB 3.x 以下版本中,节点启动时会生成对应的管道文件并存放在 /tmp/sequoiadb
目录下,sdblist
工具使用这些管道文件来获取节点的状态信息。通常情况下,操作系统会定期清理 /tmp
目录下的文件,当 /tmp/sequoiadb
目录下的管道文件被清理后, sdblist
工具将无法正常显示节点的状态信息。该问题可通过配置 /tmp
目录的清理策略,忽略不清理 /tmp/sequoiadb
目录下的管道文件进行规避。