ZStack 超融合环境下宿主操作系统升级指南

本文是关于ZStack超融合环境下宿主操作系统升级的指南,详细介绍了升级流程、注意事项和验证方法。从确认升级信息、目标、准备到具体操作,包括备份、节点顺序、网络配置等,确保业务不受影响且能迅速回滚。同时强调了升级验证的重要性,以保证云平台的功能和性能。升级过程中,建议遵循官方文档并提前进行测试,确保系统的稳定和安全。
摘要由CSDN通过智能技术生成

引 言

ZStack是开源的云计算IaaS(基础架构即服务)软件。通过提供的API来管理包括计算、存储和网络在内的数据中心的各种资源。跟OpenStack相比,ZStack具有易用、稳定、灵活等特点。

ZStack版本升级非常简单,官方的安装包已经做到了快捷,安全,简单。但是当前主流的Zstack系统的版本则横跨Centos7.2,Centos7.4,Centos7.6三个版本。虽然Zstack系统中可同时存在三个版本的宿主系统,但因安全或者其他驱动或内核因素,系统升级成为强需求。

Ceph是一种为优秀的性能、可靠性和可扩展性而设计的统一的、分布式文件系统。ceph 的统一体现在可以提供文件系统、块存储和对象存储,分布式体现在可以动态扩展。在国内一些公司的云环境中,通常会采用 ceph 作为Xstack,OpenStack 等唯一后端存储来提高数据转发效率。

XSKY主体的两个新产品——面向云计算场景的“X-CBS存储”和面向通用应用场景的“X-EBS存储”。这两个产品是基于主流开源存储系统Ceph的SDS解决方案。可替代传统SAN存储,满足企业云计算环境和通用业务环境的数据持久化需求。主要有以下特点:

  • 具备与传统SAN存储相当的丰富接口与技术,如Fiber Channel,iSCSI,SCSI,存储多路径等

  • 支持存储卷动态QoS调整和数据恢复流量控制,适应企业业务压力周期性在线变化

  • 在线扩展,全冗余架构,互联网化自运维特性

  • 统一的图形化管理,直观、简单、易用

  • 软件与硬件充分解耦,适配通用硬件;为NVMe新存储协议与高速网络充分优化,发挥高性能

  • 充分适应大多数应用负载与应用场景,无缝支持OpenStack,Zstack云

系统的升级,并不困难,但当多种软硬件环境融合在一起(私有云超融合)的时候,那么如果还是按照一般的系统升级步骤进行升级,则可能带来灾难级别的故障。这也是我们所经历过的。复杂的环境升级遵循分级操作的原则,优先升级不影响业务但相对核心的节点,然后对核心节点进行业务迁移以及节点拆分的方式进行不停服升级。

系统的升级ZStack官网并没有给出对应的升级操作指南。因此,我们在多次的升级实践中总结出以下的升级流程以及原则。

升级信息

以下信息需在升级之前进行确认,本文主要针对的是ZStack与xsky/Ceph的超融合环境。

  1. 环境配置确认

  • 版本信息:操作系统,zstack,存储版本,存储类型等。

  • 部署信息:a. 超融合(存储 Mon是否独立) b. 计算与存储独立 c. 网络类型。

  • 容量信息:管理、计算以及存储节点数量,虚拟机数量,超融合情况下存储容量等信息。

  • 平台资源使用信息:计算,存储等资源用量统计,平台当前压力统计等。

  • 特殊说明

    • 超融合的情况下,XSKY MON节点是否独立部署,如共享计算的情况下,则要优先升级。

    • 如使用VPC 类型的网络,确认VPC 虚拟路由已经迁移。

    • 管理节点是否需要升级,如管理共享计算,则要优先升级(升级之前做好备份)。

    • 超融合情况下,单台计算存储节点的数据量有多少,数据量不多的情况下推荐,数据迁移。如较多的话,升级时关闭数据均衡,进入维护模式。

  • 这里有几个重要步骤,推荐在计划任何ZStacl升级时采取

    1. 通篇详读Zstack版本注释,以识别出潜在的版本间的不兼容性。尤其在对原生代码更改的情况下,比如对接商业存储后引起的配置的不兼容。

    2. 选择合适的方法升级Zstack系统以及确认升级的目的。本质上Zstack的版本不受系统版本的影响。

    3. 准备一个升级失败的回滚计划。随时准备回滚。得益于Zstack服务都为无状态,如控制节点的升级失败,导回数据可恢复。

    4. 准备一个数据备份计划,至少,带有配置文件和数据库的备份。以及提前准备好新版本配置文件。配置文件不会因为软件的升级而升级,需要手工更新。

    5. 依照特定服务的SLAs,定一个可接受的云停机时间,如果可能存在数据丢失,服务的中断时间。升级期间尽量不要操作云平台。

    6. 在有条件的情况下,提前与平台用户核对各种情况,确认平台是否有特殊的配置。

    升级目标

    • 平滑升级,业务无影响,升级后功能组件正常。

    • 最短服务暂停时间。但云主机,云盘以及网络等云资源正常工作。

    • 升级失败可立刻回退。回退后可继续提供云服务。

    升级前准备

    1. 云主机以及数据迁移

      a. 升级涉及重启,所以需要提前将本计算节点上的虚拟机迁移到其他正常工作的资源空余节点。

      b. 超融合根据数据量确定迁移,最佳但最慢的做法是:计算存储同时迁移,升级后再进行迁移已经均衡。如需快速升

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值