资源管理、高可用与自动化(上)

当服务器、存储和网络已经被抽象成虚拟机(含容器)、虚拟存储对象(块设备、文件系统、对象存储)、虚拟网络,这些虚拟化资源从数量上和表现形式上都与硬件有了明显的区别。这个时候,数据中心至多可以被称为“软件抽象”的,但还不是软件定义的。因为各种资源现在还无法建立起有效的联系。要统一管理虚拟化之后的资源,不仅仅是将状态信息汇总、显示在同一个界面,更进一步的,需要能够用一套统一的接口,集中管理这些资源。例如VMware的vCenter和vCloud Director系列产品或Amazon AWS的Management Console能够让用户对其数据中心中或云计算基础架构中的计算、存储、网络等资源进行集中管理,并能提供访问权限控制、数据备份、高可靠性等额外的功能支持。

软件定义的数据中心中所有资源都作为一个整体,根据用户的服务请求来提供可靠、安全、灵活、弹性以及自助控制(自动化)的管理。下表中列出了以上各项指标的评估标准与实现策略。

表:SDDC资源管理评价指标与实现策略

指标说明标准策略
可靠数据中心的基础设施要不中断服务,包括硬件的正确性、性能等。数据中心的数据访问要保证正确性、可用性(完整性)服务的连续性(基本不中断)、响应时间(符合SLA)、服务完成的结果(正确)、支持多租户HA(高可用性群集)、
Checkpoint/Recovery(快照和恢复)、 Multi-tenancy(多租户)
安全数据中心的基础设施要保证服务的隔离性,不受攻击的影响;数据不发生泄露、错误或者丢失等基础设施访问控制强,数据存取访问控制强,且不泄露架构安全、数据访问安全、数据隐私保护
灵活数据中心的基础设施根据服务的要求灵活调整,并且调度好数据的迁移、存取、备份等基础设施可以动态分配和协调,数据具有良好的迁移、存储、备份能力精简配置(Thin Provisioning)、
在线迁移(Live Migration)、 负载均衡(Workload Balancing)

续表:

指标说明标准策略
弹性数据中心的基础设施可以动态扩展,并且根据服务的需求数据可以海量存储和计算基础设施可动态扩展,数据可海量存储和计算海量数据的存储与计算(Big Data
Storage and Computing)、 实时扩展性(Instant Scalability)
自动化数据中心的基础设施可以自动接入并管理,控制与数据管理分离,可自动化定制数据计算和保护策略,而数据的存储可以跨平台硬件资源自动接入,卸载和监控,数据计算、保护、存储透明监控(Monitoring)、
审计(Reconciliation)、 资源感知(Auto-Discovery)

我们在这里简要论述一下表中列出的资源管理的策略:

·资源的感知(Resource Auto Discovery):当某个物理设备接入软件定义的数据中心,需要被数据中心感知。资源感知的原理是采用物理资源服务器与设备驱动交互的方式。当某个物理资源加载或者卸载时,分为以下几步:

(1)设备驱动将指令、设备信息以及策略信息通过高速消息总线传给资源服务器;
(2)资源服务器检查指令(加载/卸载),并将设备信息以及策略信息添加或删除;
(3)资源服务器定期轮询设备的资源使用情况;
(4)资源管理器提供API供上层调用该设备。

·监控(Monitoring & Management:监控包括资源监控、安全监控、性能监控以 及数据监控等。资源监控是指对所管理的硬件资源进行监控,包括计算、网络、存储。监控的内容包含了几乎服务所关心的重要流程:

(1)消息管理;
(2)访问管理;
(3)分配管理;
(4)用户管理;
(5)业务管理;
(6)故障管理等。

由于不同的软件定义中心所采用的方法和模块工具不尽相同,以OpenStack为例,资源管理监控模块为Horizon。Horizon是一个基于Web接口的监控模块,它连接了计算管理模块Nova、存储管理模块Cinder、网络模块Quantum,以及访问控制模块KeyStone,提供了API接口供用户监控资源时使用。这样客户可以基于这些API对资源进行监控。

·审计(Reconciliation):审计是在资源监控基础上,对资源和数据的使用状况及其状态进行汇总和记录,并产生报表,以供用户日后进行故障排除以及动态性能调整时使用。常见的审计对象为数据中心架构和数据信息。数据审计的方法有:

(1)数据的有效性,数据产生的类型和质量及其产生的数据流依赖关系;
(2)数据风险,根据数据管理的函数或结构类型,对数据的操作进行分析;
(3)数据访问及重用,对数据访问进行记录,并分析可重用数据。

架构的审计方法有:

(1)系统日志,记录系统运行日志;
(2)环境配置,记录环境配置信息;
(3)访问控制,对用户登录和对资源使用等进行访问控制。

·高可用性群集(HA):高可用性群集方法原先主要为防止服务器设备的故障(如网络、存储连接断开),在数据中心里增加一个stand-by的备用节点,当主用节点突然出现故障,可使用备用节点保证数据服务的连续性。在正常服务处理客户请求时,仅有一个服务器处于激活状态。而高可用性集群实现方法可以不同。例如,根据存储设备共享不同,可以分为3种:

(1)使用镜像存储的集群。在集群中创建镜像存储,每个节点不仅写其对应的存储,而且还写其他节点上的镜像存储。
(2)不共享的集群,在任意时刻,仅有一个节点拥有存储。当前节点出现故障时,另一个节点开始使用存储。典型的例子包括IBM High Availability Cluster Multiprocessing(HACMP)以及Microsoft Cluster Server(MSCS)。
(3)共享存储。所有的节点都访问相同的存储,建立锁机制来保护竞争条件以及防止数据损坏。典型的例子包括IBM Mainframe Sysplex Techology以及Oracle Real Application Cluster。

· 快照&恢复(Checkpoint & Recovery):软件定义的数据中心利用虚拟化的资源提供服务。而快照(Snapshot)信息可以帮助记录节点的状态。当节点发生故障时,可以利用先前保存的快照,选择回退点(Checkpoint)来恢复到之前的正确状态。保存快照的对象既可以是计算节点,也可以是网络设备或存储节点。由于在软件定义的数据中心,所有的对象都是虚拟对象,因此大部分的对象快照可以是虚拟机快照(计算虚拟机、存储虚拟机、网络设备虚拟机)。设定快照的间隔时间,连续保存快照。当发生错误时,选择合适的快照进行恢复。常见的虚拟机平台Xen、KVM、VMware都有快照功能。而选择合适的回退点是一个较难的问题,选择的回退点不能离故障点远,又要保证恢复后状态正确。

· 安全保护及数据隐私(Security & Privacy):计算节点的安全保护包括系统安全和软件安全,进一步又分为漏洞攻击防御和恶意代码阻止;网络安全包括网络协议安全性,如SSL密钥保护、网络包重放攻击防御(Replay Attack)、拒绝服务攻击防御(DDos)等。在软件定义的网络中,控制节点定义的规则及策略的完整性保护是一个新问题;存储安全包括存储系统的安全、连接安全以及数据安全。在软件定义的数据中心,用户的数据都存放在云端,如何保证用户数据的隐私也是一个重要的课题。越来越多的厂商开始关注这个问题,然而目前还没有一个全面的解决办法。已有的方法包括数字水印、数据模糊(加噪音)、数据加密等。

· 负载均衡(Load Balancing):目前常见的有三种负载均衡策略:

(1)循环轮替((Round-Robin) )DNS,把同一个域名对应不同的IP,客户端将实现IP轮换,当访问某个DNS时,选择排在第一位的IP进行访问;
(2)软件负载平衡,如Apache/Nginx、LVS (Linux Virtual Server)等;
(3)弹性负载平衡(Elastic Load Balancing,ELB),其特点是可以跨区域的负载平衡(例如,美国的东西海岸、中国的北方/南方)。

· 精简配置(Thin Provisioning):精简配置主要用于软件定义数据中心的存储资源分配。利用虚拟化、容器等技术,对用户服务所需要的存储物理资源分配时,提供刚好满足用户服务所需的存储资源,而实际分配的资源等于用户服务实际使用的资源。例如在给用户服务需要150GB存储,而当前实际使用10GB,精简配置给用户的存储视图是150GB,但实际存储资源配给为10GB。精简配置的优势是按需动态分配资源,可以最大化利用存储资源。特别是软件定义数据中心集中管理存储资源时,精简配置可以帮助管理者有效管理有限的资源且提供良好的资源扩展性。目前的一些虚拟化平台如VMware的vsphere已经提供了相关的技术实现。

· 动态迁移(Live Migration):动态迁移主要用于软件定义数据中心的计算资源和存储资源。动态迁移的对象包括虚拟机以及存储的数据,一般用于性能或安全性考虑,例如负载均衡、灾备等。动态迁移已经被一些常见的虚拟化平台使用,包括VMware的vMotion、KVM的Live migration。动态迁移可以分为两种技术:前拷贝(Pre-Copy)和后拷贝(Post-Copy)。前拷贝技术原理是将虚拟机或者数据当前的快照全部从源端拷贝到目的端,再利用COW(Copy-On-Write)技术将更新的数据拷贝到目的端。后拷贝技术原理是将虚拟机或者数据主要部分(保证服务正常运行)先从源端拷贝到目的端,在目的端使用数据时,对未传递的数据向源端索要。前拷贝的优势是速度较快,但在一开始快照传输时对服务暂停操作时间较长;而后拷贝的优势是一开始主要数据传输对服务暂停操作时间较短,但整体的速度较慢,因为后续使用数据时要向源端索要缺失的数据。

·未完待续·

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值