云计算 | 中国信通院《2022 云计算白皮书》阅读、理解与总结
前言
来源:中国信息通信研究院
仅供参考
1. 云计算市场
1.1 国内外云计算市场现状对比
注意区分单位 亿美元 与 亿元,笔者没有做汇率转换;
比较项 | 国外(全球) | 国内 |
---|---|---|
增速 | 逐步回暖,触底反弹 | 高速增长 |
2021 云计算市场规模 | 3,229 亿元 | |
2021 公有云市场规模 | 3,307 亿美元 | 2,181 亿元 |
公有云增长率 | 32.5% | 70.8% |
总结:
- 全球云计算市场逐步回暖,增速实现触底反弹;
- 我国云计算市场持续高速增长;
1.2 2021年国内公有云与私有云市场对比
注意区分单位 亿美元 与 亿元,笔者没有做汇率转换;
对比项 | 公有云 | 私有云 |
---|---|---|
市场规模 | 2,181 亿元 | 1,048 亿元 |
增速 | 70.8% | 28.7% |
总结:
- 公有云有望成为未来几年中国云计算市场增长的主要动力;
1.3 国内公有云市场
公有云分为:IaaS、PaaS 与 SaaS;
注意区分单位 亿美元 与 亿元,笔者没有做汇率转换;
比较项 | IaaS | PaaS | SaaS |
---|---|---|---|
市场规模 | 1,614.7 亿元 | 196 亿元 | 370.4 亿元 |
增速 | 80.4% | 90.7% | 32.9% |
总结:
- 我国公有云 IaaS 及 PaaS 保持高速增长,SaaS 稳步发展;
- IaaS 是公有云市场大头,大体占 3/4;
- 预计在企业上云等相关政策推动下,有望在未来数年内随着数字化转型重启增长态势;
1.4 国内主要厂商公有云份额
- IaaS 前五:阿里云、天翼云、腾讯云、华为云、移动云;
- PaaS 领先:阿里云、华为云、腾讯云、百度云;
1.5 现阶段国内云计算市场的五大流派
数据来源:互联网;
- 互联网云厂商:阿里云、腾讯云、百度智能云、金山云等;
- 通信运营商:移动云、天翼云、联通云;
- 独立云厂商:优刻得、青云;
- 外资云厂商:亚马逊AWS、微软azure、IBM;
- ICT云厂商:华为云、紫光云、浪潮云;
1.6 近期 - 国内云计算产业四大特点概述
主要指近年来;
- 政策支持,建设标准:政策指引转向深度上云用云,标准建设拓展至新技术应用;
- 产业集群,东数西算:产业集聚效应明显,布局发展从东部向中西部逐步扩散;
- 需求迭代,创新部署:市场需求持续更迭,多种部署模式并存发展;(在原有 公有云、私有云、混合云 的基础上,催生出 分布式云、专有云、托管云 等新型部署模式);
- 分布式云:采用 中心云 + 边缘云 架构;
- 专有云:物理资源独享,保证数据安全。弹性按需,降低运维成本;
- 托管云:将部分应用、业务的运维和运营托管给云服务商;
- 行业应用,阶梯发展:行业应用水平参差不齐,阶梯状发展特点明显;
- 第一梯级-基本实现云计算的深化应用:互联网和信息服务业;
- 第二梯级-云化改造能力持续加深:金融、政务、交通等行业;
- 第三梯级-云化改造程度有待提升:能源、医疗、工业等行业(主要针对非核心系统);
1.7 现状 - 国内云计算产业五大特点概述
主要指 2021 年;
- 技术方面:云原生持续加速企业 IT 要素变革(分布式、小型化和自动化);
- 模式方面:算力服务助力构建全新算力经济范式(以云服务为基础,推动云网边端融合);
- 应用方面:稳保能力有效降低云上系统故障影响(稳定性和连续性);
- 安全方面:全流程安全体系积极应对云上新型威胁(云上安全机制);
- 管理方面:云优化治理助力企业成本长效管理(资源浪费的问题):
2. 云计算领域 - 五大产业特点(现状)
2.1 技术 - 云原生
2.1.1 旧技术完善,新技术涌现
- 云原生理念最早是在 2013 年被提出的;
- 早期云原生技术:集中在容器、微服务、DevOps 等领域;
- 现阶段技术:
- 扩展至底层技术(如服务器无感知技术 Serverless - 业务和基础设施分离,提供API接口);
- 编排及管理技术(如基础设施即代码 IaC - 云原生声明式操作思想的具体实践);
- 安全技术;
- 监测分析技术(如扩展包过滤器 eBPF);
- 场景化应用等众多方面;
- 其中 Serverless、IaC 技术与云原生的理念高度契合;
- 细分领域技术趋于多元化发展:容器技术领域演进出安全容器、边缘容器、裸金属容器等多种技术形态;
- 过去企业对云原生的应用多局限于技术和基础设施能力的改进,而忽略了架构和设计、组织和流程等其他 IT 要素的考量,即:
- 用户对云原生的理解认知趋于片面,没有考虑技术与业务的融合联动;
- 云原生核心技术的发展尚未成熟,无法提供满足业务发展的技术能力支撑;
总结:
- 云原生技术由容器、微服务等技术,扩展至底层技术、编排及管理等技术;
- 细分领域技术有多元化发展的趋势;
- 过去企业对云原生的应用多局限于技术和基础设施能力的改进;
2.1.2 场景模型的丰富与统一
统一XXX:实现什么或怎么做(具体来说统一了什么);
- 基础设施管理方面:统一的资源管理调度、流量管理和运行维护能力;
- 统一资源管理和统一集群调度:中心云、边缘云和数据中心统一管理调度;
- 统一流量治理:东西流量、南北流量的统一治理策略管理;
- 统一运行维护:运维能力混合多云架构(云上监控、日志、审计能力);
- 应用管理方面:统一的治理和分发能力;
- 统一应用治理:保障多集群间的弹性部署(策略和应用配置);
- 统一数据治理:实现一站式高度标准化数据基础资源设施(数据标准化);
- 统一生态管理:实现跨云的部署和分发(组件的快速上架、发布、订阅、部署、运维);
- 统一应用分发:在不同数据中心间获得一致的发布运行体验(应用负载、对外发布、环境差异和
数据存储);
- 运维管理方面:统一的安全防护和优化能力;
- 统一安全治理:安全能力下放至分布式节点(云端的微隔离、漏洞治理、威胁情报处理、云原生应用保护平台);
- 统一成本治理:根据历史情况进行智能化的弹性预测,提高资源利用率;
总结:
- 模型场景大体分:基础设施管理方面、应用管理方面、运维管理方面;
- 使用云原生技术在这些场景实现细分领域的统一;
2.1.3 云原生促使 IT 技术全面发展
技术细节:目的(具体落地技术细节);
-
促进 组织和流程 向团队自治、流程敏捷自动化 发展;
- 敏捷方法:缩短变更周期、数据驱动反馈(DevOps 原则、流程自动化工具);
- 生命周期自动化:(持续集成、持续交付部署和持续采用);
- 团队自治:(所有权去中心化、技术自由和自助配置);
-
促进 架构和设计 向 分布式、微服务化 发展;
- 细粒度组件:将应用架构微服务化;
-
促进 技术和基础设施 向 灵活弹性、自动化 发展;
- 轻量级的运行时:屏蔽部署过程中的非功能性问题,同时具备弹性资源等敏捷特性,并且需要相关组件尽可能简单和轻量(云原生容器镜像部署方式-保障代码及其运行时统一、IaC 等技术-通过编程部署、扩展和维护业务应用);
总结:
- 云原生技术促使架构和设计、组织和流程等其他 IT 要素的全面升级;
2.2 模式 - 算力服务
算力服务指的是以多样性算力为基础,以算力网络为连接,通过云计算技术将异构算力统一输出,并与大数据、人工智能、区块链等技术交叉融合,将算力、存储、网络等资源统一封装,以服务形式(如API)进行交付的模式;
2.2.1 算力服务的“三化”特点
- 整合异构算力 - 普惠化:屏蔽不同硬件架构(CPU、GPU、FPGA)的差异,以普适性地满足不同量级或不同硬件架构下的算力需求;
- 覆盖多层级算力 - 泛在化:从单一集中式部署模式向分布式、多层级部署的新模式演进;
- 统一算力输出标准 - 标准化:硬件解耦、标准化封装部署等实现算力标准化输出。同时建立统一输出标准;
总结:
- 算力服务的“三化”特点:普惠化、泛在化、标准化;
2.2.2 算力服务 与 云服务 的业态模式区别
比较项 | 算力服务 | 云服务 |
---|---|---|
算力支持 | 通用计算+智算、超算、量子计算、个人电脑和移动终端的算力 | 多以虚拟化提供的 x86 架构的通用计算为主 |
供给模式 | 以用户为中心 | 集中式计算供给 |
应用场景 | 多样(通过物联网+泛在算力方式) | 主要面向“通用”计算场景(适合数字原生企业) |
产业链条 | 强调从算力生产者、算力调度者、算力服务商以及算力消费者在内的算力产业链 | 关注云计算、人工智能等单一数字技术产业的发展程度 |
2.2.3 现阶段算力服务体系
- 网络控制与转发方面:SRv6(Segment Routing IPv6,基于 IPv6 转发平面的段路由)、确定性网络等技术打破算力与网络的边界(实时计算算力资源以匹配业务服务);
- 算力管理方面:IaC(基础设施即代码)正在成为构建算力“插座”的重要技术(通过代码管理和配置基础架构);
- 算力服务与运营方面:算力交易平台重要性凸显(平台会涉及很多角色,不是传统的一对一租赁模式);
总结:
- 现阶段算力服务已经形成初步体系;
- 主要在三个方面发力:网络控制与转发、算力管理、算力服务与运营;
2.2.4 算力经济
- 算力经济成为衡量数字经济活力的关键指标;
- (方向)算力服务从两方面赋能数字经济:
- 赋能传统行业:将云计算、边缘计算、智能计算为代表的算力融入研发、采购、生产、营销、售后等产业链环;
- 形成算力新产业:对芯片、操作系统、网络、云计算等信息技术产业进行重塑与整合;
- (行动)算力服务如何推动数字经济发展:
- 盘活社会闲置算力:现阶段全球有:过度建设、利用率较低等算力资源问题;
- 加速算力应用的产业渗透:算力经济的中心逐步从科学计算领域和互联网行业走向政府、服务业、金融、教育、制造、运输等行业;
总结:
- 算力经济成为衡量数字经济活力的关键指标;
- 算力服务主要从:传统行业、新兴行业等赋能数字经济;
2.3 应用 - 稳定性
2.3.1 现阶段系统上云的 稳定性 挑战
- 复杂度提升:云上系统的故障率会随设备的增加而呈指数级增长;
- 新旧系统的共存和过渡:相当长时间内会存在多种系统云上云下共存的局面;
- 核心业务故障影响更大:核心业务具有:连续性要求高、并发请求量大、业务激增随机性强的特点;
总结:
- 现阶段系统上云的挑战主要有:复杂度提升、新旧系统的共存和过渡、核心业务故障影响更大 等方面;
- 可以从:流程管理、技术建设 等方面保障稳定性(2.3.2、2.3.3);
2.3.2 从 流程管理方面 保障稳定性
- 业务系统故障往往存在不可预测、不可控、复杂性高等特点;
- 体系化构建安全生产机制,规范化处理系统故障:
- 事前的主动防御:故障分析、风险检测、全局管控等事前风险防护治理手段;
- 事中的全局监控:深度应用大数据、人工智能等技术,对信息系统进行全局监测和预警;
- 事后的应急保障:将信息化手段与传统方式相融合,多种应急方式;
总结:
- 可以完善事前、事中、事后 三个流程方面的管理保障稳定性;
- 事前主动防御、事中全局监控、事后应急保障;
2.3.3 从 技术建设方面 保障稳定性
- 事前做好规划工作,设计高度韧性系统:
- 系统架构设计角度:规避系统单点问题、优化系统依赖设计、完善数据保护;
- 容量规划角度:进行容量决策、资源调度,确保容量;
- 应用混沌工程技术探测系统稳定短板性:模拟各个层面故障,观测分布式系统稳定性;
- 事中全方位检测,提高系统故障逃逸能力:
- 应用多活技术:在同城或异地机房建立一套与本地生产系统部分或全部对应的生产系统,所有机房内的应用同时对外提供服务,当灾难(含基础设施故障)发生时,多活系统在分钟级内实现业务流量切换;
- 事后构建故障闭环,降低故障复现率:持续将测试与实际中故障加入故障库,进行迭代演练反馈降低故障复现率;
总结:
- 技术建设方面也分事前、事中、事后 三方面;
- 事中可以使用 应用多活技术,这是 应用容灾 的一种高级形态;
2.4 安全 - 安全机制
2.4.1 现阶段系统上云的 安全性 挑战
- 云环境面临多样化攻击手段:
- 利用云计算新技术的漏洞发起攻击(主要攻击:容器、微服务等技术的应用);
- 通过云计算的软件供应链进行攻击;
- 政策标准向云安全聚焦,合规要求更加清晰:
- 部分应用较为成熟的安全标准修订增加了云安全内容(ISO/IEC 27002:2022 完成修订并发布);
- 政策指南积极引导关注云安全新问题、新手段;
- 优化上云全流程安全机制已成当务之急:
- 软件供应链入口的安全管控(上云前);
- 零信任、统一安全运营等理念、技术的应用(上云中、上云后);
总结:
- 现阶段云上安全面临多样化攻击,为了应对攻击落地了一些安全标准与政策;
- 构建优化云上安全机制可以从:上云前、上云中、上云后 三方面入手;
2.4.2 上云前-完善供应链入口管控机制
- 应用云计算带来三大软件供应链安全挑战:
- 开源风险突出;
- 云服务商成攻击突破口,木桶效应明显(攻击云厂商);
- 不安全的分发渠道影响;
- 构建软件供应链入口安全管控体系的五大关键因素:
- 对软件或服务来源进行评审管理,确保来源安全可信;
- 对软件自身的安全合规进行管控,确保不存在安全及合规风险;
- 对软件供应链清单、软件及源代码版本、漏洞等信息进行统一管理;
- 具备软件服务支持(档材料、服务水平协议以及安全服务协议等);
- 具有明确的软件供应链安全事件应急响应人员及流程机制,确保安全事件处理的及时性、有效性;
总结:
- 应用云计算供应链的三大挑战:开源风险、攻击云厂商、分发渠道;
- 构建供应链入口管控体系的五大关键因素:软件来源、自身合规、信息统一管理、服务支持、应急机制;
2.4.3 上云中-应用零信任理念构建安全体系
- 零信任实现多云/混合云的统一访问管控:
- 多云/混合云边界变化带来的安全挑战:
- 边界模糊(传统的是边界访问控制列表);
- 大量分散用户需要统一权限控制策略;
- 零信任以身份而非网络为中心:
- 通过强身份验证与授权对所有访问主体进行管控;
- 通过统一接入、统一访问控制和统一资源纳管体系,为用户提供一致的访问体验;
- 多云/混合云边界变化带来的安全挑战:
- 零信任细化防护粒度,防微杜渐守护云工作负载安全:
- 容器化、微服务化的挑战:
- 不同类型、不同级别的业务统一访问控制能力;
- 数据中心内部流量大幅增加,边界防护无法应对威胁横向移动(零信任解决);
- 零信任如何解决威胁:
- 在工作负载构建后即可标定资产身份、角色、访问需求等,自动生成对应的安全策略;
- 通过微隔离等技术进行不同层级的安全隔离;
- 容器化、微服务化的挑战:
总结:
- 上云阶段的安全体系主要依靠零信任理念;
- 零信任理念能解决 多云/混合云统一访问、服务颗粒度细化 等带来的安全问题;
2.4.4 上云后-建立统一安全运营能力
- 云安全运营建设复杂,资源浪费、效率低等问题突出:
- 云安全运营建设的挑战:
- 过多的管理平台增加运营复杂度;
- 各安全组件独立运作存在数据孤岛;
- 云安全运营建设的挑战:
- 统一安全运营体系打破兼容性壁垒,全面提升安全运营效率:
- 如何实现统一:
- 汇总多源安全数据使安全分析全局化;
- 提高安全组件联动能力使安全响应迅速精准;
- 实现统一安全运营的两种方式:
- 安全运营中心( Security Operation Center , 简 称 SOC );
- 建立面向各安全组件的开放统一架构;
- 扩展的检测与响应(Extended Detection and Response,简称 XDR);
- 聚焦单供应商的安全组件整合;
- 安全运营中心( Security Operation Center , 简 称 SOC );
- 如何实现统一:
总结:
- 上云后的运营安全挑战主要有两方面:管理平台过多、各安全组件数据不互通;
- 需要建立统一的安全运维能力,可以使用:安全运营中心SOC 和 扩展的检测与响应XDR;
2.5 管理 - 优化成本
2.5.1 云资源浪费问题
- 云资源浪费成为企业用云普遍现象:
- 常常导致企业云资源盲目采购、过度申请,缺乏对云资源容量合理有效的规划;
- 企业在云资源的分配、使用和管理过程中缺少约束和规范,导致浪费;
- 企业云成本优化治理面临诸多难题:
- 资源浪费难以识别,有效资源优化手段匮乏(企业对已购资源使用情况不了解);
- 云账单数据庞大繁杂,缺乏专业工具支撑;
- 混合云加大优化难度,云产品计费模式复杂多变;
- 优化流程管理不健全,团队协作效率不佳;
总结:
- 在企业上云过程中常常出现采购、分配不合理的云资源浪费问题;
- 企业云成本优化也面临诸多问题;
- 解决办法:需要各角色团队长期协作、辅以工具和运作机制,建立覆盖企业上云、用云和持续运营全流程的长期优化体系(2.5.2、2.5.3);
2.5.2 人员、工具和机制是云成本优化的关键要素
- 人员是基础,业务、财务和技术须同频运作:
- 组建云成本优化团队需要考虑的三个方面:
- 人员构成需要跨职能(多重人员、跨部门);
- 人员知识体系须完备;
- 管理层须认可与支持;
- 组建云成本优化团队需要考虑的三个方面:
- 工具是抓手,监控、分析与调优是必备能力:
- 云成本优化需要什么:
- 云成本优化策略需要基于大量运营分析数据(不适合人工完成);
- 需要工具沉淀部分优化策略模型(构建可度量的成本指标);
- 云成本优化工具通常需要具备三方面能力:
- 可以明确资源使用情况并进行调整(前提,如可视化工具支撑);
- 可以关联资源与费用并进行可视化(费用可视等);
- 工具可以综合分析企业数据与云服务产品并进行优化建议(基于成本优化算法);
- 云成本优化需要什么:
- 机制是保障,成本意识和奖罚机制双轮驱动:
- 云成本优化流程制度包含的三个方面:
- 对企业内部云成本进行权限管控(支出采购、分配修改等);
- 企业云资源各采购账号进行体系管理(账单核算、托管代付等);
- 对企业各类资源或成本进行统一的配额管理(资源开通、支出审批等);
- 如何落实云成本优化制度:
- 宣传云成本优化意识和文化;
- 建立 KPI 奖惩制度;
- 云成本优化流程制度包含的三个方面:
总结:
- 人员是基础,业务、财务和技术须同频运作;
- 工具是抓手,监控、分析与调优是必备能力(多指可视化监控工具);
- 机制是保障,成本意识和奖罚机制双轮驱动;
2.5.3 云成本优化流程贯穿上云用云全生命周期
- 上云阶段-精细规划上云方案:
- 技术选型方面:明确公有云或 IDC,考虑技术红利;
- 权限规划方面:提前规划企业云上 IT 治理结构;
- 采购模型方面:选择适合的资源和付费方式;
- 用云阶段-识别低效率资源,采取措施:
- 检查:配额闲置、忙闲时流量、提前预警等方面存在的潜在问题;
- 持续运营阶段-关注云计算成本的长效运作机制:
- 如何建立企业的成本优化实施体系:
- 制定成本运营目标;
- 制定技术与管理协同优化方案(从:管理降本、技术降本 入手);
- 定期召开成本会议改进优化策略;
- 如何建立企业的成本优化实施体系:
总结:
- 可从上云阶段、用云阶段和持续运营阶段制定相应技术和管理策略方法,实现成本节约;
3. 云计算展望
3.1 具体表现
- 云原生架构应用将更加普及;
- 算力服务技术体系将更加完善;
- 云上系统稳定性将更加优先;
- 云安全建设工具将更加便捷(统一安全管理、新工具);
- 云优化治理内涵将更加广泛;