CTyunOS自动升级部署
- 自动化工具安装
自动化升级部署主要用到工具为x2ctyunos,通过该工具能够自动从centos7.6升级到对应的ctyunos系统。
1.1、x2ctyunos 工具安装
1)前提要求说明
在需要升级的机房找一台有公网IP的centos7的服务器,建议带宽50M以上。
要求:该服务器能够ssh 联通所升级的服务器。
1)安装包
目前使用的最新版本是3.0.0
安装包地址,由于文档内容限制,需要安装包的请联系欧明珠获取。
2)部署过程
步骤1:
yum install -y x2openEuler-core-3.0.0-1.gp01.x86_64.rpm
步骤2:
据提示切换到/usr/local/x2openEuler/portal/service/目录,执行service_init.sh脚本,选择server对外提供的IP(保证该IP可以和待升级服务器通过ssh连通),其他配置默认即可。
步骤3:
按照上一步脚本的提示在浏览器输入进行web界面的登录。
1.2、工具使用手册
1)web页面登录
浏览器输入进行web界面的登录(这里的地址IP需要更换成实际使用的IP地址)
以之前登录的地址为例
在浏览器输入
设置初始登录密码后,输入密码,同意免责声明后登录。
2) 新建任务选择系统升级
3)填写任务名称,选择添加单个节点进行系统升级(也可以选择批量导入后进行批量升级,建议批量升级的机器最好是功能和配置一致的一批机器)。
4)特别说明,用户名使用root,如果待升级系统是禁止root远程登录的,需要修改带升级系统的ssh,并重启sshd服务
在带升级系统上运行:
sed -i 's/PermitRootLogin no/PermitRootLogin yes/g' /etc/ssh/sshd_config && systemctl reload sshd
5)源选择。
如果没有也可以手动添加,源地址内容:
[ctyunos3-everything]
name=ctyunos3-everything
baseurl=https://repo.ctyun.cn/x2/ctyunos-23.01/everything/aarch64/
enabled=1
gpgcheck=0
priority=30
[ctyunos3-update]
name=ctyunos3-update
baseurl=https://repo.ctyun.cn/x2/ctyunos-23.01/update/aarch64/
enabled=1
gpgcheck=0
priority=20
6)高级选项
这里业务软件一般填写/opt就行。
7)前后置脚本
下面2个脚本front.tar.gz 主要是升级前运行的,init.tar.gz主要是升级完重启后运行的。主要修复了各业务系统升级到ctyunos后出现的一些问题。具体可以查看脚本内容。
需要注意的是,脚本要上传到工具所在服务器的以下路径
/opt/x2openEuler/scripts-execute/upload/
格式要求是xxx.tar.gz
- 确定添加节点后,确认新添加节点的指纹信息。方便后续server对client进行ssh远程访问。最后再次确认,节点添加完毕。
- 下图是升级所升级到的步骤
需要注意的是连通性检查第一次有很大可能会失败,一般情况下再点一次重试就OK。如果还是不行,需要检查root是否可以远程登录,root账号密码是否正确等
10)连通性检测通过后,如果升级前置脚本的话会执行前置检查运行前置脚本
接着进行升级前检查。升级前检查耗时会比较长,尤其是将升级用的rpm包从repo源中下载到本地比较耗时。
- 升级前检查完成后未发现软硬件兼容性的问题,就可以开始进行系统升级了。
- 升级完成后,需要重启
- 重启完后,后置脚本运行,如果设置有的话
14)系统检查如果升级正常的话就可以选择环境清理,注意,清理后就不能回退了。
- 各业务系统升级问题及修复
目前业务升级后遇到的问题(2.1--2.14小节)都可以通过运行以下2个脚本自动修复。
这2个脚本的使用方法请参考1.2小节的第7点内容。
- 升级过程中一些问题处理
- 正常升级一台需要30分钟左右。
- 可以批量升级,批量升级一次最大建议10台。时间大概40分钟左右。
- 升级过程中可能会遇到卡住情况。
目前只能再系统上将该进程删除。再重新添加升级任务。
具体操作方式如下:
cd /usr/local/x2openEuler/portal/src/
sqlite3 db.sqlite3
sqlite> .tables
sqlite> delete from taskmanager_node where ip_address="192.168.141.61";
sqlite> .quit
上面的IP是被卡住节点的IP。
删除后再回到 web 页面重新创建升级任务就行。
- 升级完成后,有可能遇到重启后卡住的情况,如果等待一段时间后还是不行,需要联系云公司手动重启,重启完后再在web上操作任务。
5. 升级完成后需要注意原有的服务是否有启动。