DRBD9和LINSTOR用户指南——使用DRBD——11.常见的管理任务——11.2。检查DRBD状态

最新推荐文章于 2025-02-11 13:14:02 发布

allway2

最新推荐文章于 2025-02-11 13:14:02 发布

阅读量1.4k

点赞数

本文链接：https://blog.csdn.net/allway2/article/details/102460241

版权

本文详述了DRBD状态的多种检查方法，包括使用drbdmon、drbdtop和drbdadm命令，以及如何通过drbdsetupevents2进行实时监控。介绍了资源角色、磁盘状态和连接状态的概念，提供了资源的启用、禁用、重新配置、角色切换和故障转移的操作指南。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

11.2。检查DRBD状态

11.2.1。使用drbdmon检索状态

drbdmon实用程序是查看DRBD状态的一种便捷方法。它实时更新DRBD资源的状态。

11.2.2。通过drbdtop检索状态并与DRBD交互

顾名思义，它drbdtop与的工具具有相似之处htop。一方面，它允许监视DRBD资源以及进行交互（例如，将它们切换为Primary，甚至解决裂脑问题）。完整的概述可以在这里找到[ https://linbit.github.io/drbdtop/ ]。

11.2.3。中的状态信息/proc/drbd

/proc/drbd不推荐使用。尽管在8.4系列中不会将其删除，但我们建议您切换到其他方式，例如通过drbdadm；或者，为更加方便地进行监视，可通过进行一次或实时监视drbdsetup events2。

/proc/drbd是一个虚拟文件，显示有关DRBD模块的基本信息。它在DRBD 8.4之前得到了广泛的使用，但跟不上DRBD 9提供的信息量。

$ cat /proc/drbd

version: 9.0.0 (api:1/proto:86-110) FIXME

GIT-hash: XXX build by linbit@buildsystem.linbit, 2011-10-12 09:07:35

第一行以开头version:，显示系统上使用的DRBD版本。第二行包含有关此特定版本的信息。

11.2.4。状态信息通过drbdadm

在最简单的调用中，我们只要求单个资源的状态。

# drbdadm status home

home role:Secondary

disk:UpToDate

nina role:Secondary

disk:UpToDate

nino role:Secondary

disk:UpToDate

nono connection:Connecting

这只是说资源主页在本地，“ nina”和“ nino”上UpToDate和Secondary上；因此，这三个节点在其存储设备上具有相同的数据，并且目前没有人在使用该设备。

节点“ nono”未连接，其状态报告为正在连接；有关更多详细信息，请参见下面的连接状态。

您可以通过将--verbose和和或 --statistics参数传递到drbdsetup（为了便于阅读而中断的行）来获取更多信息：

# drbdsetup status home --verbose --statistics

home node-id:1 role:Secondary suspended:no

write-ordering:none

volume:0 minor:0 disk:UpToDate

size:1048412 read:0 written:1048412 al-writes:0 bm-writes:48 upper-pending:0

lower-pending:0 al-suspended:no blocked:no

nina local:ipv4:10.9.9.111:7001 peer:ipv4:10.9.9.103:7010 node-id:0

connection:Connected role:Secondary

congested:no

volume:0 replication:Connected disk:UpToDate resync-suspended:no

received:1048412 sent:0 out-of-sync:0 pending:0 unacked:0

nino local:ipv4:10.9.9.111:7021 peer:ipv4:10.9.9.129:7012 node-id:2

connection:Connected role:Secondary

congested:no

volume:0 replication:Connected disk:UpToDate resync-suspended:no

received:0 sent:0 out-of-sync:0 pending:0 unacked:0

nono local:ipv4:10.9.9.111:7013 peer:ipv4:10.9.9.138:7031 node-id:3

connection:Connecting

在此示例中，每隔几行形成一个块，该块对该资源中使用的每个节点重复执行，本地节点的格式异常很小-有关更多详细信息，请参见下文。

每个块的第一行显示node-id（对于当前资源；主机可以node-id在不同资源中具有不同的）。此外，还将显示role（请参阅资源角色）。

下一条重要的代码行是volume规范。通常，这些编号从零开始编号，但是配置也可以指定其他ID。此行在项目中显示连接状态 replication（有关详细信息，请参阅连接状态），在其中显示远程磁盘的状态disk（请参阅磁盘状态）。那么，对于这种体积给人有点统计的线-数据received，sent，out-of-sync等; 请参阅性能指标和连接信息数据以获取更多信息。

对于本地节点，在我们的示例中，第一行显示资源名称home。由于第一个块始终描述本地节点，因此没有连接或地址信息。

请参阅drbd.conf手册页以获取更多信息。

此示例中的其他四行形成一个块，该块针对每个配置的DRBD设备重复，并以设备次设备号为前缀。在这种情况下，它0对应于device /dev/drbd0。

特定于资源的输出包含有关资源的各种信息：

11.2.5。通过一站式或实时监控drbdsetup events2

仅在用户空间版本8.9.3及更高版本中可用。

这是一种从DRBD中获取信息的底层机制，适用于自动化工具（如监视）。

在最简单的调用中，仅显示当前状态，输出看起来像这样（但是，在终端上运行时，将包括颜色）：

# drbdsetup events2 --now r0

exists resource name:r0 role:Secondary suspended:no

exists connection name:r0 peer-node-id:1 conn-name:remote-host connection:Connected role:Secondary

exists device name:r0 volume:0 minor:7 disk:UpToDate

exists device name:r0 volume:1 minor:8 disk:UpToDate

exists peer-device name:r0 peer-node-id:1 conn-name:remote-host volume:0

replication:Established peer-disk:UpToDate resync-suspended:no

exists peer-device name:r0 peer-node-id:1 conn-name:remote-host volume:1

replication:Established peer-disk:UpToDate resync-suspended:no

exists -

如果没有“ --now”，该进程将继续运行，并发送如下的连续更新：

# drbdsetup events2 r0

...

change connection name:r0 peer-node-id:1 conn-name:remote-host connection:StandAlone

change connection name:r0 peer-node-id:1 conn-name:remote-host connection:Unconnected

change connection name:r0 peer-node-id:1 conn-name:remote-host connection:Connecting

然后，出于监视目的，还有另一个参数“ --statistics”，它将产生一些性能计数器和其他事实：

'drbdsetup' 详细输出（为便于阅读，行被断开）：

# drbdsetup events2 --statistics --now r0

exists resource name:r0 role:Secondary suspended:no write-ordering:drain

exists connection name:r0 peer-node-id:1 conn-name:remote-host connection:Connected

role:Secondary congested:no

exists device name:r0 volume:0 minor:7 disk:UpToDate size:6291228 read:6397188

written:131844 al-writes:34 bm-writes:0 upper-pending:0 lower-pending:0

al-suspended:no blocked:no

exists device name:r0 volume:1 minor:8 disk:UpToDate size:104854364 read:5910680

written:6634548 al-writes:417 bm-writes:0 upper-pending:0 lower-pending:0

al-suspended:no blocked:no

exists peer-device name:r0 peer-node-id:1 conn-name:remote-host volume:0

replication:Established peer-disk:UpToDate resync-suspended:no received:0

sent:131844 out-of-sync:0 pending:0 unacked:0

exists peer-device name:r0 peer-node-id:1 conn-name:remote-host volume:1

replication:Established peer-disk:UpToDate resync-suspended:no received:0

sent:6634548 out-of-sync:0 pending:0 unacked:0

exists -

您可能还喜欢``--timestamp''参数。

11.2.6。连接状态

可以通过发出以下drbdadm cstate命令来观察资源的连接状态：

# drbdadm cstate <resource>

Connected

StandAlone

如果您只对资源的单个连接感兴趣，请也指定连接名称：

默认值为配置文件中指定的对等方的主机名。

# drbdadm cstate <peer>:<resource>

Connected

资源可能具有以下连接状态之一：

单机版

没有可用的网络配置。资源尚未连接，或者已通过管理方式断开连接（使用drbdadm disconnect），或者由于身份验证失败或头脑分裂而中断了连接。

断开连接

断开连接时的临时状态。下一个状态是StandAlone。

未连接

尝试连接之前的临时状态。下一个可能的状态：正在连接。

暂停

与对等方通信超时后的临时状态。下一状态：未连接。

断管

与对等方的连接丢失后的临时状态。下一状态：未连接。

网络故障

与伙伴的连接丢失后的临时状态。下一状态：未连接。

协议错误

与伙伴的连接丢失后的临时状态。下一状态：未连接。

拆除

临时状态。对方正在关闭连接。下一状态：未连接。

连接中

该节点正在等待，直到对等节点在网络上可见。

连接的

已建立DRBD连接，数据镜像现在处于活动状态。这是正常状态。

11.2.7。复制状态

每个卷在每个连接上都有一个复制状态。可能的复制状态为：

关

由于该连接不是Connected，因此不会通过该连接复制该卷。

成立时间

该卷的所有写操作均在线复制。这是正常状态。

StartingSyncS

由管理员启动的完全同步才刚刚开始。下一个可能的状态是： SyncSource或PausedSyncS。

正在启动SyncT

由管理员启动的完全同步才刚刚开始。下一个状态：WFSyncUUID。

WFBitMapS

部分同步才刚刚开始。下一个可能的状态：SyncSource或PausedSyncS。

WFBitMapT

部分同步才刚刚开始。下一个可能的状态：WFSyncUUID。

WFSyncUUID

同步即将开始。下一个可能的状态：SyncTarget或PausedSyncT。

同步源

当前正在运行同步，本地节点是同步的源。

SyncTarget

同步当前正在运行，本地节点是同步的目标。

暂停同步

本地节点是正在进行的同步的源，但是同步当前已暂停。这可能是由于依赖于另一个同步过程的完成，或者是由于同步已被手动中断 drbdadm pause-sync。

暂停同步

本地节点是正在进行的同步的目标，但是当前已暂停同步。这可能是由于依赖于另一个同步过程的完成，或者是由于同步已被手动中断 drbdadm pause-sync。

验证

当前正在运行在线设备验证，本地节点是验证的来源。

验证码

当前正在运行在线设备验证，本地节点是验证的目标。

先

由于链接无法应对负载，因此数据复制已暂停。此状态由配置on-congestion选项启用（请参阅配置拥塞策略和挂起的复制）。

背后

由于链接无法应对负载，因此数据复制被对等方暂停。此状态由on-congestion对等节点上的配置选项启用（请参阅配置拥塞策略和挂起的复制）。

11.2.8。资源角色

可以通过发出以下drbdadm role命令来观察资源的角色：

# drbdadm role <resource>

Primary

您可能会看到以下资源角色之一：

主

资源当前处于主要角色，可以从中读取和写入。除非启用了双主模式，否则此角色仅在两个节点之一上发生。

次要的

该资源当前处于次要角色。它通常会从其对等方接收更新（除非以断开连接模式运行），但是既不能读取也不可以写入。此角色可能发生在一个或两个节点上。

未知

该资源的角色目前未知。本地资源角色永远不会具有此状态。它仅针对对等方的资源角色显示，并且仅在断开连接模式下显示。

11.2.9。磁盘状态

可以通过发出以下drbdadm dstate命令来观察资源的磁盘状态：

# drbdadm dstate <resource>

UpToDate

磁盘状态可能是以下之一：

无盘

尚未将本地块设备分配给DRBD驱动程序。这可能意味着该资源从未连接到其后备设备，或者已经使用进行了手动分离drbdadm detach，或者在发生较低级别的I / O错误后自动分离了该资源。

附加

读取元数据时的瞬态。

拆卸

分离并等待正在进行的IO完成时的瞬态状态。

失败的

本地块设备发出I / O故障报告后的瞬态状态。下一个状态：无盘。

谈判中

在已连接的 DRBD设备上执行附加时的临时状态。

前后不一致

数据不一致。在两个节点上创建新资源后，此状态立即发生（在初始完全同步之前）。同样，在同步过程中在一个节点（同步目标）中找到此状态。

过时的

资源数据是一致的，但已过时。

D未知

如果没有网络连接可用，则此状态用于对等磁盘。

一致的

没有连接的节点的一致数据。建立连接后，将确定数据是UpToDate还是Outdated。