作者:私语茶馆
1.前言
由上文《有趣的数据中心发展史和商业模式分析》可知数据中心本质是向企业/个人开放包括:机房、服务器、软件等租赁服务,并获得盈利。最基本的就是出租机房和相关设施。具体可参考:“有趣的数据中心发展史和商业模式分析-CSDN博客”一文。
本文以AWS/阿里云为例,重点讲述数据中心容灾和物理组网,以及企业上云时如何使用这些服务。
2.数据中心容灾基础设施
2.1.容灾的必要性
对于企业而言:企业的ERP/Email/会议系统等等都是支撑生产活动的必要系统,其可用性直接影响到生产效率。例如紧急召开远程会议,发现系统故障了,那么慎重会带来严重后果,导致问题处理不及时。所以企业自动化系统都需要容灾。
对于IDC厂家而言:一旦没有达成可用性协议,直接影响到收入,我们以阿里云2018年协议看一下服务可用性(容灾支撑的)的影响(最新规定以阿里官方为准,这里仅供分析):
服务可用性与赔偿金额
服务可用性 | 赔偿代金券金额 |
低于99.5%但等于或高于99.00% | 月度服务费用的10% |
低于99.00%但等于或高于95.00% | 月度服务费用的25% |
低于95.00% | 月度服务费用的100% |
由上表可见,服务可用性要>99.5%,其中服务可用性计算公式如下:
服务可用性=((服务周期总分钟数-服务不可用分钟数)/服务周期总分钟数)×100%
服务周期总分钟数:按照服务周期内的天数╳24(小时)╳60(分钟)计算。
服务不可用分钟数:当某一分钟内,客户所有试图与指定的高速通道实例建立连接的连续尝试均失败,则视为该分钟内该高速通道实例服务不可用。在一个服务周期内高速通道实例不可用分钟数之和即服务不可用分钟数。
服务周期:一个服务周期为一个自然月
简单估算,就是一个月内,最多只能累计有216分钟无法使用云上的服务,否则面临赔偿。
2.2.数据中心物理容灾架构
通常企业建设多数据中心的思路是:
- 企业数据中心一般选择在同城50km 范围内再建立备份数据中心,作为主数据中心的备份,实现数据备份和双活。
- 另外考虑到不可抗拒的自然灾害(如地震)对地区城市的毁灭性破坏,建议企业在有能力的情况下,在另外一个距离大于400km 的城市建立灾备中心,用于主备双中心的备份,定时同步生产中心和同城灾备中心的数据。
按照上诉要求形成了两种灾备架构:
- 两地三中心架构:生产数据中心,同城灾备中心,异地灾备中心,两个城市三个数据中心互备
- 异地多活:多个地点建设多个数据中心,数据能在三个及以上DC之间双向同步,
不管怎么说,这些都是IDC厂家需要构筑的基础设施,相关信息见数据中心建设流程做为参考。
3.企业如何应用IDC容灾能力
IDC厂家会把容灾能力抽象成若干软件概念,以AWS为例会将容灾能力抽象为包括Region/AZ等在内的多个虚拟对象,企业在自动化系统上云时通过选择部署虚拟数据中心的Region/AZ来应用AWS的容灾能力。例如同城主备可以将软件部署在不同的AZ,异地灾备可以部署在不同的Region。下面详细介绍这些关键概念
3.1.Region/AZ容灾概念
Region: 数据中心的大型地理区域,不同地域建网络完全隔离,不能通过内网通信
AZ:可用区包含在Region内,1个或多个物理数据中心集合,有独立水电的数据中心集合,AZ可以划分多个集群,用于故障隔离;,属于同一个region的AZ可以做同城灾备;DC:物理数据中心
例如North California region( us-west-1)是一个region,Region下有三个AZ, us-west-1a , us-west-1b, us-west-1c,AWS S3服务默认分布在一个Region,3个Az上,但EC2的服务,需要自己创建;
Region和AZ的关系
VDC:可以有多个数据中心
VPC:虚拟云:隔离的虚拟的网络环境,一般VPC只能在一个AZ,但VPC可以跨多个AZ;
3.2.DC/VDC/VPC
DC(DataCenter):数据中心,数据中心。DC是物理概念,是指在一个物理空间(比如机房)内实现信息的集中处理、存储、传输、 交换和管理。服务器、存储和网络设备是DC的关键设备,供电、制冷、消防、监控等基础设施是DC的关键配套。
VDC(virtual data center):虚拟数据中心,VDC是一个组织可使用资源的集合,一般包括计算、存储和网络资源。在形式上类似于一个物理数据中心,是物理数据中心在虚拟化层的表现。
VPC(Virtual Private Cloud),虚拟私有云:VDC的网络结构控制对象,VPC是特定AWS区域中AWS资源的隔离边界,在概念上类似于我们在私有数据中心中创建的用于存放IT资源的私有网络。VPC提供隔离的虚拟机和网络环境,满足不同业务/部门的。本质是VDC的组网结构
图1-VDC和VPC的关系
图2 Region/AZ/VPC的关系
由图2知AWS的约束:VPC只属于一个Region,VPC.Subnet只属于一个AZ,跨VPC的APP,需要通过创建多个VPC来实现;
3.3.Fabric/TOR/堆叠
fabric架构:一组spine以leaf节点互联组成数据中心基础物理网络拓扑,用于支撑VPC的构建。其中spine/leaf节点的作用是:
- spine:骨干节点,VXLAN fabric网络核心节点,提供高速IP转发功能,通过高速接口连接各个功能leaf节点。
- leaf:叶子节点,VXLAN fabric网络功能接入节点,提供各种网络设备接入VXLAN网络功能。
、
Spine/Leaf架构
- TOR(Top of Rack):TOR接入方式是一种由服务器到交换机或交换机到交换机的一种较为常见的布线方式。当TOR交换机位于服务器机柜顶部,起到衔接服务器与核心层或汇聚层交换机的作用时,则称之为接入层交换机;当TOR交换机位于交换机机柜顶部,则称为汇聚层或核心层交换机。
TOR交换机是一种交换机在数据中心的布线方式。节点是一个连接点,表示一个再分发点或一个通信端点(一些终端设备)。其他的布线方式还有EOR、MOR等。
- 堆叠:是指把多台支持堆叠技术特性的单独交换机组合在一起,从逻辑上组合成一台整体交换机。交换机之间通过堆叠线缆连接在一起,从逻辑上像一台交换机实现报文转发,同时用户使用一个IP对堆叠进行管理和维护。
3.4.POD
POD:point of delivery,数据中心基本物理设计单元,包括服务器、接入网络、汇聚网络机柜还有它们的配套设施,算是整个组网的一个区域,整个组网包括多个pod,用pod划分可以提高整个组网的利用率,便于计算虚拟化,pod中有接入、汇聚、核心三层结构,不过现在的应用fabric+大二层多一点。
POD分区
4.数据中心组网模型
4.1.数据中心架构图
DC和云操作系统和APP的关系
图中的部分概念:
- IMS(IP Multimedia Subsystem): IP多媒体系统,语音、视频、数据融合的服务,下一代软交换
- EPC(Evolved Packet Core):5G网络核心模块,连接到IMS
- ERP(Enterprise Resource Planning)企业决策支撑系统
- CRM(Customer Relationship Management):客户关系管理
- BI/OLAP:基于数据仓库的企业决策析系统,BI(Business Intelligence), OLAP(Online Analytical Processing)。 OLAP是在线分析技术 即联机分析或多维分析,由Edgar Frank域1993年提出的概念,通过多种维度审视数据,主要操作包括:下钻、上卷、切片、切块等;现代BI系统基于SaaS模式,中小型公司不用再搭建数据仓库,例如GA,神策分析、友盟分析等,类似excel的透视表,多维度分析
4.2. 物理组网模型
规模 | 组网模型 | 业务模型 | 优缺点 | 适用场景 |
中小型DC <2W台服务器 | 两级Clos (Spine/leaf) | EVPN/ Overlay | 网络简单可靠;跨Leaf一跳可达 | 大企业汇聚机房、边缘机房、边缘计算网络 |
大中型DC [2W,10W]台服务器 | 三级Clos架构 Spine/Pod spine/leaf | - | 以Pod为单位部署业务 | |
大型DC [10W,~] | 基于盒式设备的多平面组网 从100G组网向200G、400G组网演进 | - | Spine分平面,PodSpine只和对应平面Spine连接 | 互联网,本质是spine分区, Spine、Pod Spine设备、架构类似,所以转发时延和网络性能 |
伴随数字化转型的深入,“场景化”一度成为近两年的热词。而就在计算和存储设备还在为不同场景的需求和设计绞尽脑汁时,网络的场景化却早已在业内成为共识。
两级Clos架构
三级Clos架构
基于盒式设备的多平面组网
4.2.数据中心业务逻辑组网
数据中心分区架构示意图:
5.AWS企业上云关键组网模式
5.1. 模式1:企业内有公网IP资源连接Internet
AWS模式:公网资源访问Internet
AWS上的配置步骤分为5步:
- Step1.Create VPC
- Step2.CreateSubnet, 子网属于一个AZ
- Step3.Create EC2 with Public IP&SecurityGroup(防火墙)
- Step4.Create Internet GateWay(CloudSec-igw),绑定VPC
- Step5.Create路由表,包含Internet的路由(0.0.0.0/0),并绑定到子网上
测试结果:可以从远端终端67.188.94.249,通过SSH登录到EC2,并执行ping www.google.com可达
主要的配置步骤截图
5.2.模式2:企业内私网IP资源连接Internet
6. 关联章节
上一章:
参考资料
https://cloudsecuritymasterclass.com/aws/intro-vpc/
https://www.cnblogs.com/jesse123/p/14288332.html
https://blog.csdn.net/Rao_Limon/article/details/85320265