处理Inactive OSTS
挂载一个客户端或者MDT带有一个或者多个Inactive OST,执行类似下面的命令:
client# mount -o exclude=testfs-OST0000 -t lustre uml1:/testfs /mnt/testfs
client# lctl get_param lov.testfs-clilov-*.target_obd
激活正在完好运行的客户端或者MDT上的Inactive OST,使用 lctl activate 命令在OSC设备上。eg:
lctl --device 7 activate
Note:
也可以指定一个冒号分割的列表;eg: exclude=testfsOST0000:testfs-OST0001
找到Lustre文件系统中的所有节点
在MDS上执行下面这条命令,能够得到所有Lustre节点的列表:
# lctl get_param mgs.MGS.live.*
Note:
这个命令必须在MGS上运行。
本例中,文件系统 testfs 有三个节点,testfs-MDT0000 , testfs-OST0000 , 和
testfs-OST0001 。
mgs:/root# lctl get_param mgs.MGS.live.*
fsname: testfs
flags: 0x0 gen: 26
testfs-MDT0000
testfs-OST0000
testfs-OST0001
得到所有OST的名字,在MDS执行以下命令:
mds:/root# lctl get_param lov.*-mdtlov.target_obd
Note:
这个命令必须在MGS上运行。
本例中,有两个OST, testfs-OST0000 和 testfs-OST0001 ,都是活动状态:
mgs:/root# lctl get_param lov.testfs-mdtlov.target_obd
0: testfs-OST0000_UUID ACTIVE
1: testfs-OST0001_UUID ACTIVE
网络检测(Lnet)
# lctl list_nids
12.0.6.131@tcp1
# lctl ping 语法
# lctl ping <nids>
# lctl ping 12.0.6.131@tcp1
12345-0@lo
12345-12.0.6.131@tcp1
# 直接ping12.0.6.131是不对的,应为默认的是tcp不是nids输出tcp1
# lctl ping 12.0.6.131
failed to ping 12.0.6.131@tcp: Input/output error
P114