ceph集群单个数据盘的raid方式不同(单盘raid0、jbod、多盘raid0),所使用的服务器不同(惠普、戴尔等),因此在换盘时,如何能让管理系统识别这个新盘,所需要的操作也不同,通过改手册换盘,减去了底层手工格式化文件系统、启动osd等步骤;
服务器概况
厂商:Huawei(/sys/devices/virtual/dmi/id/chassis_vendor)
型号:5288 V3(/sys/devices/virtual/dmi/id/product_name)
系统盘:
2块hdd盘做raid1
数据盘:
hdd盘:单盘做raid0(容量盘集群、性能优化型集群)
ssd盘:单盘JBOD,用作bcache(性能优化型集群)
ssd盘:5块盘做raid0、6块盘做raid0(高性能盘集群)
更换系统盘
系统盘使用两个hdd盘做raid1的方式,坏了一个之后不影响系统盘的使用。并且可以直接换盘,raid信息不会丢失。
更换数据盘-HDD
容量盘使用单盘做raid0的方式,换盘后raid信息会丢失,需要重新做raid0;
厂家更换硬盘
确认硬盘状态
/opt/MegaRAID/storcli/storcli64 /c0 show all
在线配置raid0
1)确认storcli已安装;
如果没有,则进行安装
wget mirrors.bclinux.org/megacli/storcli-1.21.12-1.noarch.rpm
rpm -ivh storcli-1.21.12-1.noarch.rpm
2)在线做raid0
/opt/MegaRAID/storcli/storcli64 /c0 add vd r0 drives=0:9
其中:
/c0表示控制器;r0表示raid0;0:9表示硬盘背板ID:硬盘slotid,与上面一一对应;
注意:做raid时要查看对应VD的读写策略是否正确,可在命令后加相关参数设定读写策略。
3)有cache的情况
查看cache
并执行
/opt/MegaRAID/storcli/storcli64 /c0/vall delete preservedcache
清除cache后再做raid0即可;
更换数据盘-SSD-性能优化型集群
性能优化型集群中,ssd使用JBOD的方式作为缓存盘使用。
更换数据盘-SSD-高性能型集群
高性能集群中SSD盘有两种raid方式:5块盘做raid0,6块盘做raid0。
5块盘做raid0,6块盘做raid0参考以下步骤进行操作。
厂家更换硬盘
确认硬盘状态
/opt/MegaRAID/storcli/storcli64 /c0 show all
通过硬盘编号查看该块盘属于哪个raid组
/opt/MegaRAID/storcli/storcli64 /call show all
删除raid组
多块盘做raid0的,当其中一块盘故障后,整个raid组将会失效,需要将该raid组删除。
/opt/MegaRAID/storcli/storcli64 /c0/v2 del #v2代表VD 2
新建raid组
将故障raid组删除后,需要将修复好的硬盘与其他硬盘一起重建一个raid组。
/opt/MegaRAID/storcli/storcli64 /c0 add vd r0 drives=0:7-11 aftervd=1 WT nora
其中:
r0代表raid0
drives=0:7-11 代表物理磁盘编号7-11的五块盘
aftervd=1 代表VD编号接着VD 1,即VD 2(VD编号要和故障前的VD编号保持一致)
WT 代表直写模式
nora代表 No Read Ahead