前不久Ceph推出了最新的稳定版本Jewel。由于工作的需要,对J版的功能,性能要进行测试与验证。现有测试环境中的ceph集群是H版本,因此对它要进行升级。升级过程中遇到了较多的问题,现把这些问题以及自己的解决方式记录下来,给需要的朋友做个参考。其中肯定会有些不准确的地方或者自己理解有误的地方,欢迎大家指出来^_^
本次升级,主要是把有8台物理机的ceph集群,从H版(0.94.7)升级到J版(10.2.2),主要参考了官方升级文档
http://docs.ceph.com/docs/master/release-notes/#v10.2.2-jewel。由于物理机无法连接外网,采用了同事搭建的yum源。
1.更新各机器上的yum配置文件,将ceph-deploy配置文件中,cephrepo修改成jewel版本的yum源。
2.利用ceph-deploy install命令,更新各台机器上的安装包。在执行该步时,建议先将要更新的机器上的服务停掉。之前自己没有停服,直接把各个机器上的安装包更新了,走了不少弯路。
3.在更新某一台物理机时,如果之前部署过calamira服务,建议先将其停了。这个可能会引起后续无法启动服务的问题,但也不是肯定会引起,在实践中,有两台没停,服务也起来了。
4.如果在