一、产品介绍

FusionCompute是云操作系统软件,主要负责硬件资源的虚拟化,以及对虚拟资源、业务资源、用户资源的集中管理。采用虚拟计算、虚拟存储、虚拟网络等技术,完成计算资源、存储资源、网络资源的虚拟化。FusionCompute在虚拟机实例发放、集群资源池管理、HA/FT智能调度等方面提供调优的高性能和高可靠性。

二、功能模块介绍

VRM:虚拟资源管理。实现虚拟资源集中管理的节点,是FusionCompute的核心控制器。

1️.管理集群内的块存储资源。

2️.管理集群内的网络资源(IP/VLAN),为虚拟机分配IP地址。

3️.管理集群内虚拟机的生命周期以及虚拟机在计算节点上的分布和迁移。

4️.管理集群内资源的动态调整。

5️.通过对虚拟资源、用户数据的统一管理,对外提供弹性计算、存储、IP等服务。

6.提供统一的操作维护管理接口

CNA:计算节点代理。代理部署在每个计算主机上以执行操作。

1️.提供虚拟计算功能。

2️.管理计算节点上的虚拟机。

3️.管理计算节点上的计算、存储、网络资源。

Host:为FusionCompute提供计算资源的物理服务器。某些主机还可以提供存储资源。

存储资源:存储资源可以由存储区域网络 (SAN) 设备、网络附加存储 (NAS) 设备或本地存储设备提供。

UVP:基于SUSE的华为FusionCompute的hypervisor。

三、实际场景及日常运维(巡检)

1、日常监控

一方面对系统,可以查看系统告警。另一方面对机房环境,服务器等设备运行情况也要进行周期性检查。

FusionCompute备份与恢复及常见故障处理_网络资源

FusionCompute告警分为4个等级:紧急、重要、次要、提示。在有告警时,先处理高级别告警,再处理低级别告警。在FC(FusionCompute)的界面上,管理员可以查看集群、主机以及虚拟机的监控信息,以便于了解集群在指定时间段内的运行状态。

2、配置管理

在FusionCompute系统管理中,可以查看任务与日志,可以修改系统权限、系统配置、业务配置、第三方对接和网络变更

管理员根据需求可以对FC系统配置参数做出相应调整,具体可调整内容如下。

FusionCompute备份与恢复及常见故障处理_数据存储_02

在“任务与日志”->“任务中心”当中可以查看操作任务的进度。

FusionCompute备份与恢复及常见故障处理_数据存储_03

四、FusionCompute 巡检

1、管理节点、计算节点通过系统命令判断IO、CPU、磁盘、内存资源占用相关情况进行调整。

五、FusionCompute备份与恢复

作用:为了保证出现意料之外的情况下数据可以恢复,在对系统进行重大操作前(比如升级、数据调整),需要提前对VRM节点数据进行备份。

注意以下几点:

1.FC支持自动备份和手动备份两种备份方式

2.系统默认在每日凌晨02:00自动进行备份

3.默认每月1日做一次月备份,备份文件保存两份(本月1日和上月1日)

4.备份文件数超过最多保存数时,会自动清理创建时间最早的文件

5.若有第三方备份服务器,在完成本地备份后,会自动上传备份文件至第三方服务器

六、故障处理

1、主机和集群故障处理

结合创建集群并为集群添加主机的过程来思考,可以把主机和集群的故障分为以下几种可能:

站点故障、集群故障、主机故障、系统接口故障

站点、集群故障:不能使用FC,不能创建、修改、移除集群,集群配置故障

可能原因:-网络异常-VRM节点异常-站点配置异常-集群配置异常

FusionCompute备份与恢复及常见故障处理_网络资源_04

主机故障:不能添加、修改、移除主机,主机配置故障

可能原因:网络异常-代理服务异常-系统异常

FusionCompute备份与恢复及常见故障处理_数据库_05

系统接口故障:网口绑定异常,业务管理接口异常,存储接口异常

可能原因:网络异常,主机异常,VRM异常

FusionCompute备份与恢复及常见故障处理_数据库_06

存储故障处理

存储池可能涉及到的故障点:存储资源,存储设备,数据存储,虚拟磁盘故障。

存储资源和存储设备故障:不能添加、修改、删除存储资源,不能关联存储资源,扫描不到存储设备。

可能原因:存储网络链路异常,对端存储设备异常,主机存储接口异常

FusionCompute备份与恢复及常见故障处理_运维_07

数据存储故障:不能添加、修改、移除数据存储,关联、解关联主机异常,数据存储异常

可能原因:

CNA节点与存储设备的网络连接故障。

CNA节点上虚拟化的本地存储文件系统损坏。

CNA节点上NAS共享存储文件系统损坏。

CNA节点上虚拟化的共享存储文件系统损坏。

存储设备的磁盘损坏。

CNA节点上的本地磁盘损坏。

CNA节点上的SAN存储被格式化成gpt分区。

FusionCompute备份与恢复及常见故障处理_运维_08

虚拟磁盘故障:不能创建、绑定、解绑定、删除虚拟磁盘,调整容量异常,快照异常,磁盘迁移异常。

可能原因:数据存储异常,磁盘类型限制,磁盘配置模式设置,虚拟机状态限制。

FusionCompute备份与恢复及常见故障处理_服务器_09

存储资源裸设备映射不支持扩容

2、网络故障处理

网络可能涉及的故障点:分布式交换机故障,上行链路故障,VLAN池故障,端口组故障,子网故障(可以概括为虚拟机之间通讯故障,虚拟机与外网通讯故障)。

虚拟机之间通讯故障:同一主机内虚拟机通信异常,不同主机内虚拟机通信异常。

可能原因:端口组配置异常,分布式交换机异常,VLAN池异常,子网异常等。

FusionCompute备份与恢复及常见故障处理_数据库_10

虚拟机与外网之间通讯故障:虚拟机不能访问外网,或者访问慢

可能原因:上行链路异常,主机网络服务异常,外部交换机配置异常,硬件故障

FusionCompute备份与恢复及常见故障处理_网络资源_11

虚拟机和模板故障处理

虚拟机创建方式和流程:

创建方式:直接创建虚拟机、使用模板创建虚拟机、克隆虚拟机

创建流程:选择创建位置->设置虚拟机属性->配置网卡磁盘->完成创建

故障点:创建、调整、回收虚拟机故障,模板转换、部署、导入导出、管理故障。

参考上述流程逐一检查:

虚拟机OS不兼容

计算资源限制

网络资源限制

存储资源限制

外部共享目录访问异常

FusionCompute备份与恢复及常见故障处理_服务器_12