异常状态展示
登陆系统显示后端服务异常,但是挂在的PV可以正常使用,ceph -s 也没有提示异常。
[root@master01 ~]# kubectl get job -n rook-ceph
NAME COMPLETIONS DURATION AGE
rook-ceph-osd-prepare-master01 0/1 8s 3h3m
rook-ceph-osd-prepare-master02 1/1 8s 3h3m
rook-ceph-osd-prepare-master03 1/1 8s 3h3m
rook-ceph-osd-prepare-master 主要功能是:
- 检查磁盘和设备:确定哪些磁盘和设备可以用于 OSD。
- 初始化磁盘:在需要时,对磁盘进行分区和格式化,以便它们可以被 Ceph 使用。
- 配置 OSD:为 OSD 配置相关参数和设置,使其能够加入 Ceph 集群并正常工作。
排查过程
## 事件日志
kubectl get events --sort-by=.metadata.creationTimestamp
## 检查出现问题的节点有无资源耗尽的问题
kubectl describe node master01
## 确保Ceph 配置正确,特别是OSD设备有无问题
kubectl -n rook-ceph get cephcluster
kubectl -n rook-ceph get cephblockpool
## 检查磁盘状态,尤其检查OSD需要使用的硬盘
## 查看日志
kubectl -n rook-ceph logs -l app=rook-ceph-osd
## 或者
kubectl -n rook-ceph logs -l app=rook-ceph-operator
## 重新出发OSD Pod 准备
kubectl edit cephclusters.ceph.rook.io -n rook-ceph
## 到此问题解决