新钛云服已为您服务1445天
如果你在实施或维护中参考以下最佳实践,Ceph将变的非常简单,以下的描述是很基本和有用的,我们每天使用基本的Ceph命令管理我们内部和客户的集群。
如果遵循部署和维护的最佳实践,Ceph将变得很简单和容易操作。以下是我们日常去管理我们内部和客户的Ceph集群的一些最基本和最有用的命令。
一、status
首先也是最重要的命令是**ceph -s**
** 或 **ceph status**
,这通常是你在任何Ceph集群中想要运行的第一个命令。输出的内容也包含了许多其他的命令输出并合并到一起,可以查看集群的健康状况、大小、使用量、和任何可能会发生的问题。**
**HEALTH_OK**
是你想要找的,这表示你晚上可以睡个好觉了,而不是**HEALTH_WARN**
或**HEALTH_ERR**
,这可能表示驱动器或节点错误或故障。
其他关键的输出是查看有多少个OSD在线或不在线,有多少服务在运行,例如rgw或cephfs,以及他们是如何运行的。
$ ceph -s
cluster:
id: 7c9d43ce-c945-449a-8a66-5f1407c7e47f
health: HEALTH_OK
services:
mon: 1 daemons, quorum danny-mon (age 2h)
mgr: danny-mon(active, since 2h)
osd: 36 osds: 36 up (since 2h), 36 in (since 2h)
rgw: 1 daemon active (danny-mgr)
task status:
data:
pools: 6 pools, 2208 pgs
objects: 187 objects, 1.2 KiB
usage: 2.3 TiB used, 327 TiB / 330 TiB avail
pgs: 2208 active+clean
二、osd tree
接下来是**ceph osd tree**
,它提供了每个OSD的列表还包括类、权重、状态,OSD所在的节点,以及任何重新加权或优先级。在OSD故障的情况下,这是你首先要查看的地方,比如说您需要查看OSD日志或本地节点故障一样,这将为你提供正确的引导。OSD通常根据大小相互加权,因此1T OSD的权重是500G SSD的两倍,以确保集群以相同的速率填满OSD。
如果在tree中特定OSD存在问题,或者是你的集群规模很大,但你需要快速的在不使用grep以及滚动浏览文本输出的情况下找到单个OSD的详细状态,你可以使用osd find,这个命令能够帮助你通过单个命令识别OSD的IP地址和机架位置等。
$ ceph osd tree
ID CLASS WEIGHT TYPE NAME STATUS REWEIGHT PRI-AFF
-1 329.69476 root default
-3 109.89825 host danny-1
0 hdd 9.15819 osd.0 up 1.00000 1.00000
1 hdd 9.15819 osd.1 up 1.00000 1.00000
2 hdd 9.15819 osd.2 up 1.00000 1.00000
3 hdd 9.15819 osd.3 up 1.00000 1.00000
4 hdd 9.15819 osd.4 up 1.00000 1.00000
5 hdd 9.15819 osd.5 up 1.00000 1.00000
6 hdd 9.15819 osd.6 up 1.00000 1.00000
-7 109.89825 host danny-2
12 hdd 9.15819 osd.12 up 1.00000 1.00000
13 hdd 9.15819 osd.13 up 1.00000 1.00000
14 hdd 9.15819 osd.14 up 1.00000 1.00000
15 hdd 9.15819 osd.15 up 1.00000 1.00000
16 hdd 9.15819 osd.16 up 1.00000 1.00000
17 hdd 9.15819 osd.17 up 1.00000 1.00000
-5 109.89825 host danny-3
24 hdd 9.15819 osd.24 up 1.00000 1.00000
25 hdd 9.15819 osd.25 up 1.00000 1.00000
26 hdd 9.15819 osd.26 up 1.00000 1.00000
27 hdd 9.15819 osd.27 up 1.00000 1.00000
28 hdd 9.15819 osd.28 up 1.00000 1.00000
$ ceph osd find37
{
"osd": 37,
"ip": "172.16.4.68:6804/636",
"crush_location": {
"datacenter": "pa2.ssdr",
"host": "lxc-ceph-main-front-osd-03.ssdr",
"physical-host": "store-front-03.ssdr",
"rack": "pa2-104.ssdr",
"root": "ssdr"
}
}
三、df
与 *nix df 命令类似,它告诉