云架构师学习------云存储白皮书深入理解

云架构师学习------云存储白皮书深入理解

云架构师学习------云存储白皮书深入理解

行业描述

数字经济时代的到来

1、基础设施的云化

自人类社会诞生以来,先后经历了农业经济、工业经济、网络经济等时代。
今天,我们迎 来了由 IT 经济、DT 经济、智能经济所组成的数字经济时代。

根据联合国发布的《2022 年数字经济报告》的统计,数字经济的规模约占全球生产总值的 10%。从参与数据驱动的数字经济并从中受益的能力来看,美国和中国脱颖而出。

根据 IDC 的相关预测,未来五年,全球数据量将会增长一倍以上,这其中,中国本土的数 据量会仅次于北美地区,达到大概 56.16ZB 的规模,另外年复合增长率接近 25%,增长 率将成全球第一,也就是说,未来几年中国将会超越北美地区成为全球最大的数据市场。

多方数据的汇聚以及对数据“存储-使用-管理”的全生命周期支撑能力、全方位的数据安全 体系和健全的数据生态环境、以数据为中心实现数据价值最大化是以存储、计算、网络等 基础设施所需要解决的重要问题。

而今天,云计算已经在关键技术和应用规模上实现对传统基础设施的超越,基础设施全面 云化的进程已然开启。
一方面,新基建、“东数西算”等国家战略级定位的重点项目敲开了 B 端市场的大门,为云 计算发展带来了大片市场蓝海。另一方面,技术融合成为数字经济重要发展趋势,云计算 与数据中心、人工智能、工业互联网等的融合碰撞将摩擦出新的火花。

行业之间出于业务共性、方案成熟度、部署和维护等方面的考虑,上云的过程中存在较大 差异。为了避免行业云的设计方案因人而异或因事而异,需要通过标准将行业云要求清晰 准确地列出,做到有章可循。除已发布的和在研的国家标准、行业标准之外,公共云服务 商也需要不断制定自己的相关标准,让上云更加高效便捷。

2、核心技术互联网化

作为分布式处理、并行处理和网格计算融合发展的产物,云计算从 2006 年正式诞生,时 至今日,云计算已经成为一门独立的学科。

今天,大数据、物联网和人工智能等技术正在引领云计算的发展。在各行各业不断拥抱互 联网的当下,在企业组织数字化转型的当下,在产业互联网蓬勃发展的当下,需要更加适 合互联网场景的技术升级方案。

从成立的第一天开始,阿里巴巴就具有了独特的互联网基因,在过去的二十年,阿里巴巴不断应对互联网时代的诸多挑战,从而在今天构建起并梳理了数字经济时代的底层范式和技术脉络。

基础设施的云化需要一套新的技术体系,需要基于互联网技术来进行改造。这其中最为明 显的例子就是对象存储的兴起,在最初就将存储视为一种服务的对象存储,在应对互联网 数据存储的规模化、高增长等问题的时候,提出了具有划时代意义的全新解决方案。

对象存储面向互联网、移动互联网而生,专为大量网页、视频、图片、音频等数据的存储和管理等场景而设计。对象存储采用基于互联网的访问接口,其本质是通过互联网或移动 互联网访问相关内容,为应用提供了全局、全网共享的数据池化管理,非常适合作为视频、 社交、音乐等互联网应用的底层平台。

现在,对象存储已经拥有了面向海量数据存储、快速访问的能力,不但可以构建数据统一 分析平台,还可以进一步挖掘数据的价值,让存储更智能。

互联网经济的蓬勃发展很大程度上也源自于开源技术的繁荣。开放、开源是互联网技术的 重要基因。阿里巴巴是开源的受益者,也是开源的贡献者。可以预见,下一代技术将构建 在基于互联网技术、开源技术、云原生的云化基础设施之上,在这一过程中,阿里巴巴已 经积累了丰富的经验和最佳实践,这套技术体系的可行性和先进性也已经被充分证明。

3、应用数据化和智能化

数据化和智能化是数字经济的重要特征,而云计算是应用数据化和智能化的有力保障。随 着技术的不断发展以及架构的不断演化,云计算简化了传统 IT 产品的供应链流程,提升了产品弹性。

在实现了平台和产品分离的同时,通过平台升级带动产品升级,实现了产品版本的快速迭 代,使产品具备实时发布和实时使用的智能化特征。借助“数据+智能”这个出口,云计算 将能够根据不同企业和组织的规模、类型、行业等为其量身打造上云方案。万事万物都将 被数字化,都会因为数字化而产生进一步走向全面智慧化、智能化的空间和驱动力。

在具体实践中,数据智能服务已普遍应用在不同业务中来辅助人工决策。决策智能开始逐 步代替人工,通过全流程智能化、自动化的升级,从辅助人工决策走向全流程自动化决策。

以阿里云存储为例,在完成了以弹性扩展、灵活高效、降低成本为核心的存储基础服务以 后,已经实现了支撑集团 100%业务上云的目标,同时还帮助越来越多的客户实现数据管 理的数字化和智能化。

在针对不同业务场景上,阿里云发布了智能媒体管理 IMM,为云上文档、图片、视频提供一站式数据处理、分析、检索等智能管理。阿里云存储不再是一个单一的底层平台,而是 升级为数据智能管理的平台。

存储行业的变革

1、存储服务网络的巨变

云计算让原本离散的、依靠渠道实现分发的蒲公英网络演进为具有更高的服务效率、迭代效率、发现效率、运营效率等四大优势的平行网络。这其中,自服务是云计算核心的竞争力之一。

传统 IT 技术所构建的商业模式不再成立,云计算的自服务能力让企业可以像使用水和电一 样使用云计算产品,在可管理性方面有了极大的提升,也避免落入依赖技术和产品外包的 服务陷阱。从这个角度来说,相比于强调所有权的公有云,强调使用权的公共云的概念其 实更为贴切。

云存储是基于云计算相关技术延伸和发展而来的全新的产品形态。本质上,云计算不是一 种计算,而是服务,云存储也不是一种存储,而是一种基于存储功能的服务

云存储的内核是应用软件与存储设备相结合,通过应用软件来实现存储设备向存储服务的 转变。如同云状的广域互联网,云存储对使用者来讲,不是指某一个具体的设备,而是指 一个由多个存储设备和服务器所构成的集合体。因此使用云存储时并不是使用某一个存储 设备,而是使用整个云存储网络带来的一种数字化服务。

网络互连是分布式存储的基础,随着半导体存储介质的发展,存储网络的问题越来越突出。 盘古针对存储网络面临的低延迟、高吞吐、CPU 占用等问题,提出了新的存储网络协议及 技术架构。具体包括用户态 TCP 协议栈 LUNA、增强型 ROCE RDMA 以及全自研 RDMA 网 络协议及软硬一体技术架构。通过高性能存储网络技术的演进,带来了如下技术创新:
1)解决了分布式存储互连存在的性能问题,盘古构建了全球最大规模的增强型 RDMA 存 储网络,解决传统 RDMA 面临的 PFC 等问题。在规模化生产环境下,端至端 I/O 延迟降低至 100us 以内,造就了全球性能第一的 ESSD 云盘。

2)降低处理网络协议栈的 CPU 开销、减少内存拷贝,持续升级数据中心存储物理网络技 术架构。将数据中心存储互连提升至 2x100Gbps,网络带宽利用率达到 90%以上,并 向更高速率的网络技术发展。

3)自研 RDMA 存储网络协议栈,发展 HPCC (high performance control center)络拥塞 控制算法。通过 RDMA 协议提升硬件卸载的效率,降低网络丢包率,提升存储网络利 用率,解决存储场景下面临的 Incast 等重要问题,促进存储网络向高性能方向演进。

4)通过端网协同能力,提升链路探测的效率,降低存储 I/O 的长尾延迟,提升存储系统 的 QoS 能力,为用户提供极致的 SLA。

盘古存储网络相关技术在阿里云得到了规模化,也积累了一系列创新成果,自研的高性能 RDMA 存储网络(SIGCOMM 2022)、HPCC 流控算法(SIGCOMM 2019)、RDMA 网络的 大规模实践和优化(NSDI 2021),引领了云存储进入微秒延迟时代。

2、云原生对云存储的新要求

云原生(Cloud Native)的概念在 2015 年开始被提及,主要包括容器、服务网格、微服务、不可变基础设施和声明式 API 等技术领域。

云原生计算基金会(Cloud Native Computing Foundation)认为云原生技术有利于组织 在公共云、私有云和混合云以及新型动态环境中快速构建和运行可弹性扩展的应用。

作为下一代云计算的核心技术内核,云原生对于企业竞争优势的原生放大具有重要作用。
全面上云的拐点已经到来:

1)从单次购物节大促到日常业务运营,已经实现了常态化的上云;从边缘业务到核心链路 和关键业务,已经实现了核心业务的上云;

2) 从几百台机器到超过十万台机器,已经实现了规模化的上云;

3)从单一技术到全栈技术,已经实现了多样化的上云,上云已经成为一种必然。

除此之外,上云不仅是业务需要面向云端,研发同样需要面向云端。云原生的出现让业务获得了更灵活的部署能力,同时也能够挖掘出在线数据的更大价值。

云原生技术正在深刻改变着应用服务的方方面面,而存储作为应用运行的基石,也面临着 新的需求和挑战。

云原生场景下,用户在云存储基本能力之上又提出了效率、弹性、自治、稳定、应用低耦合、安全等方面的新诉求。数字红利催化、云原生架构驱动、存储技术演进,三重背景共 同推动着存储迈进云原生存储时代。

首先,云原生存储是面向应用的应用层存储,是云存储在用户接口和效率、易用性等优势 的集合;
其次,云原生存储利用云存储基础设施红利,是构建在应用存储之上的分层存储; 第三,云原生提升了实现效率和自治方面的能力,提升了存储稳定性,降低了安全隐患。

阿里云为国内头部云厂商,具备提供丰富的云原生能力的基础,深耕云原生领域多年,从 最开始布局容器,到核心系统云原生化,再到 2022 年提出核心云产品全面 Serverless 化, 阿里云始终以先行者的视角布局技术,不断带给业界新的想象空间。

阿里云存储不断演进 Serverless 能力,智能适配负载变化,提供智能数据管理能力以及 全场景覆盖不断发展的新负载。在中国信通院组织的《云原生存储能力要求》测评中,阿 里云块存储 EBS、对象存储 OSS、文件存储 NAS 等产品通过了 2022 年度云原生存储能 力首批评估。

3、智能与存储的交相辉映

人工智能技术的发展让存储产品在打破数据孤岛,提升数据管理效率等方面有了更多可能。

阿里云提供了丰富的数据管理功能,通过数据分析挖掘数据价值。以阿里云日志服务的智 能运维分析功能为例,该功能面向趋势预测、异常发现、智能聚类和根因分析等四个场景, 提升了 DevOps 分析和诊断的效率,帮助运维人员提前配置资源,提前预测、发现和解决 突发故障。

借助人工智能技术,阿里云存储产品在磁盘、服务与网络的故障检测中,可以更加准确地 预测到故障的发生:
1)在遇到网路抖动等异常状况时,可以做到及时规避,大大减少长尾延迟现象;
2)在业务调度中,利用人工智能技术,能够提前进行负载均衡,避免热点的不均衡;
3)在数据的放置策略中,可以根据对冷热数据的分析以及客户访问的规则与模式,将不同 类型的数据进行分类,执行不同的置放策略,实现更加智能的分级存储,从而提高总体系统效能。

针对机器学习与人工智能计算的场景,阿里云推出了高性能并行文件系统(CPFS:Cloud Parallel File System),并广泛应用于 AIGC、AI 训练、自动驾驶、生命科学和渲染仿真等 场景。

灵骏智能计算结合 CPFS 可以实现 TB/s 级吞吐能力的高性能存储系统、微秒级延迟,它还 实现了一份数据多个协议的同时访问的能力,使得不同的应用可以根据需要用不同的接口 进行访问。

同时,在语音、图像、文本模型训练以及渲染仿真等领域,很多时候都存在着大量的只读 小文件,其 IO 模式非常固定,但同时又耗时极长,灵骏为此提供了专门的加速工具 KSpeed,对整个数据 IO 作业的流水线进行了重构,通过结合使用高速缓存和数据预处理技术,大大 缩短了数据 IO 的时间。

为了应对图片和视频数据的快速增长,对数据进行智能分析成为刚需,阿里云的智能媒体 管理系统(IMM)将先进的分析算法与存储相结合,通过简单便利的调用接口,使得中小 客户也可以享用到阿里云以及达摩院强大且先进的人工智能技术服务。

技术产品(阿里云为例)

自研分布式存储技术

1、飞天盘古

1)功能优势
分布式存储因其支持块、文件、HDFS、对象多种协议的特性,具有较好的场景适应性。面 向云计算的大规模分布式存储系统,往往需要历经纯软件技术架构、用户态技术架构,再到软硬一体全栈融合技术架构的发展阶段。

从 2008 年问世以来,飞天盘古作为阿里巴巴集团、蚂蚁集团业务的数据存储平台,在存 储技术的理解、分析、分类和抽象等方面持续创新,一方面为了适应硬件的迭代更新;另 一方面还要满足大规模及复杂业务场景的存储需求,主要体现在四个方面,即开放分层的 分布式存储软件、高性能存储网络、硬件适配性和硬件架构创新,以及深度软硬融合的闪 存存储架构。

一个大规模、高性能、高可靠、高可用、可伸缩的分布式存储平台,不仅需要为对象存储、 表格存储、块存储、文件存储等不同存储产品提供分布式持久化核心存储层,而且要为上 层的大数据处理、数据库、中间件、日志分析、邮箱、搜索等基础服务提供底层数据存储服务。

在这里插入图片描述
2)稳定性优势
开放分层的软件架构是飞天盘古在系统架构演进上的重要实践经验。飞天盘古数据服务层 从上到下分为飞天盘古服务层、飞天盘古分布式功能层、单机存储引擎层和软硬件一体化层。

飞天盘古分布式功能层是一个公共的基础核心,提供多副本文件(典型配置为三副本)及 纠删码文件的文件语义,并支持 Direct I/O 及 Buffer I/O 适应不同业务访问模式的需求。

分布式功能层采用分布式元数据管理,支持单集群的大规模及系统的可伸缩性;提供良好 设计的异常处理机制及数据复制机制,保证节点异常的性能稳定性及数据可靠性;采用端 到端的 QoS 保证业务运行的 SLA;采用端到端的 CRC 校验保证数据传输和存储过程中的数 据完整性;后台 CRC 校验机制保障数据持久存储的可靠性;支持快速介质与慢速介质构成 的混合存储模式,达到性能与成本的均衡。

3)性能优势
开放分层架构具备定义稳定和良好的接口,有利于系统自身的快速迭代。不仅如此,飞天 盘古针对不同的硬件特点及应用场景进行了深度的优化和设计,包括:
分布式元数据服务。增强整体系统的元数据服务器能力,支持海量文件规模、灵活伸缩扩 展,并摒弃中心节点带来的不足,提升分布式存储的可靠性及性能。

自研的分布式一致性协议。对软硬件异常进行容错,在保证可靠性的基础之上提升性能。

分布式纠删码技术将数据冗余从典型的 3 份副本降低至 1.5 份副本以下。

全自研的用户态存储引擎支持 NVMe SSD 和 HDD 介质,充分发挥 NVMe 的性能,保证后 端存储的 I/O 延时在 10us 以内;通过用户态存储引擎挖掘 HDD 磁盘的吞吐带宽,比基于 Ext4 的存储引擎性能翻倍。

全链路 SLA 服务保证 I/O 的稳定性,通过异常节点探测算法、异步写追加等方法来增强端 至端的 I/O 服务质量。

在网络互联方面,飞天盘古针对存储网络面临的低延时、高吞吐、CPU 占用等问题,提出 了新的存储网络协议及技术架构。具体包括用户态 TCP 协议栈 Luna、增强型 RoCE(RDMA over Converged Ethernet)、全自研 RDMA 网络协议及软硬一体技术架构。在规模化生产 环境下,端至端 I/O 延时降低至 100us 以内,造就了全球性能第一的 ESSD 云盘。

2、弹性让云成为可能

弹性是云计算的核心价值,是每个企业,每个团队,每个 IT 工作者所追求的目标。阿里云 弹性计算首席架构师蔡俊杰认为,从广义上讲,弹性让 IT 能力轻松跟上客户的业务发展; 从狭义上讲,弹性则带给客户无与伦比的灵活性。

在这里插入图片描述
从资源利用角度来说,弹性意味着性价比,根据相关数据统计:在实现云端部署之后,综合成本会下降 50%。弹性是云计算技术中公认的最重要的特点之一。弹性实现了按需增减 计算、存储、网络等各种资源。

阿里云的弹性贯穿于整个产品生态,客户可以根据业务负载、增长预测、实际应用设置触 发条件,实现资源的动态调整。在 2022 北京冬奥会期间,阿里云支撑赛事运营所需的核 心系统 100%上云。这是奥运史上首次由云计算替代传统 IT,改变了过去奥运重复建设传 统 IT 机房,在赛事短暂使用后拆除的状况。应用开发和部署流程缩短,IT 基础设施的成本 大幅下降。阿里云存储在弹性方面实现了按量付费和按实际使用量付费,无需提前一次性 投入。同时,自动弹性扩展存储的容量和文件数目也满足了 EB 级海量数据存储的需求。

另一方面,随着公共云、专有云、混合云等平台之间的数据及业务迁移变得更加灵活和便捷,云计算的外延也不断扩大并延展到边缘现场环境中。容器、微服务、服务网格、无服 务器计算等新的技术架构不断涌现、不断创新,这些也将进一步助力云存储不断提升自身 的弹性,推动了数字经济时代组织架构的改变以及文化的变革。

3、软件的重新定义

Gartner 于 2013 年提出的“软件定义一切”仍余音绕梁,由硬盘、磁带以及云等存储介质 组成的存储金字塔架构正在受到越来越多的冲击,存储架构进一步简化,实现了通过数据 的使用而不是底层存储介质来定义数据。软件创新使等简化的存储架构可轻松用于更多的细分市场,例如媒体和娱乐、能源,甚至是中小企业市场。

新的简化模型使组织可以将大部分不活跃的数据从昂贵的存储主层(由闪存、NVMe 和其 他固态技术以及高性能磁盘组成)中移到更为经济的冷存储层,或者称之为永久层。用户 也可以将数据的多个副本存储在对象存储、磁盘和磁带等在内的多种更为经济的存储介质 上。永久层还可以用于第二存储、数据分发、备份、存档和灾难恢复等业务上。同时,也 可以将永久层设置为根据客户工作流程的需求进行响应,从而使用户可以创建响应副本或 在云、磁带上创建灾难恢复副本。这些功能,都有赖于软件对数据存储、访问方式的重新定义。

软件与硬件的发展往往是紧密结合的,在这个过程中,既离不开不同介质硬件的自我革新— —比如 SSD 的普及、比如阿里云自研的神龙服务器;也离不开软件的不断创新——通过开放 接口的方式进一步提升存储系统效率,借助硬件和软件产品的集成,确保硬件可以在软件 的支持下得到性能的优化。

存储系统架构经过不断演进,已经从硬件定义时期演变到软件定义时期——通过软件的能力 在通用廉价硬件基础之上构建可靠数据存储系统,最明显的例子就是 SDS(软件定义存储) 近几年的快速发展,它使存储软件与底层硬件分离,使企业可以更好的利用标准化硬件从 而获得成本、效率等方面的回报。根据 IDC 数据,2019-2021 三年来,传统存储硬件市场 份额从 65%下降至 52%,市场份额持续萎缩。照此趋势,未来数年内 SDS/HCI 硬件市场 份额有可能超过传统存储,成为企业存储主流解决方案。新的存储技术如持久内存(PM)、 存储类内存(SCM)、NVMe oF 等,将进一步推动 SDS 系统的发展。

4、多种数据灾备及加密方式

安全可靠是阿里云始终坚守的重要底线。为此,阿里云执行多层次、全链路、全方位的安全加密策略,实现业务安全、运营安全、数据安全、网络安全、应用安全、主机安全和帐 户安全以及底层数据中心安全。此外,还提供了完全托管服务,用户不再需要自己规划容 量的扩容和备份。

与传统灾备服务相比,云灾备具有投入成本低、敏捷运维、资源服务化、多系统应用等优 势。早在 2018 年 6 月,阿里云已经正式对外发布了国内第一家云原生混合云备份服务和 混合云容灾服务,提供云上备份与容灾的保护能力,客户可实现灾备方案的分钟级部署。 国内首家发布同城三可用区域部署能力的云上对象存储,可满足企业级客户对于发生机房 级灾难事件时数据不丢、业务不断的需求。

相比于建设线下同城容灾机房,对象存储同城区域冗余存储提供 99.95%的可用性 SLA 指 标、12 个 9 数据可靠性和一键部署云上同城容灾服务能力,结合“跨区域复制”能力,可 实现机房、同城、跨地域三级完整的容灾服务能力。对象存储的多版本功能,使得用户可 保留、恢复文件的历史版本,且可设置历史版本保留时间,防止人为或程序的出错,提升容错能力。

云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能, 主要用于异地容灾的业务场景。通过 ESSD 云盘对数据进行周期性跨地域复制,客户可以 非常方便地在阿里云全球 28 个地域,根据业务需求来选择生产站点和灾备站点,实现高等 级、低成本的数据级容灾架构。

在数据加密方面,对象存储的多次读取特性允许用户以“不可篡改、不可删除”的方式进行 云上数据合规保存。对象存储的数据加密功能涵盖客户端加密、服务端加密,可结合密钥 托管服务,并支持用户以自有密钥方式进行加密,大大提升数据安全与合规能力。

混合云备份 HBR 提供备份源端加密,并支持基于 SSL/TLS 的 HTTPS 加密传输,有效防止 数据在云端的潜在安全风险。

文件存储推出的传输加密、落盘加密功能,通过托管密钥、自有密钥加密充分保证数据在 传输中的安全性。

各类存储产品

在这里插入图片描述

1、对象存储

- 产品介绍
阿里云对象存储 OSS(Object Storage Service)是一款海量、安全、低成本、高可靠的 云存储服务,提供 99.9999999999%(12 个 9)的数据持久性,99.995%的数据可用性。多 种存储类型供选择,全面优化存储成本。

2023 年 4 月,阿里云对象存储推出全新预留空间产品(Reserved Capacity),客户购买 一年的预留空间,较按量付费,最高可节省 70% 的费用。预留空间适用于多种业务场景 下的数据存储与管理,如互联网音视频、数据湖、云相册、视频监控等业务场景。无地域 属性预留空间则适用于对数据存储地域无要求,可接受仅通过外网进行数据读取访问的客户。

- 产品优势:
∙ 更安全:完善的权限控制与多种加密算法的支持,满足企业数据安全与合规要求。
∙ 更可靠:OSS 的多重冗余架构设计,为数据持久存储提供更可靠的保障。
∙ 更稳定:提供高达 99.995%的可用性 SLA 承诺,为客户提供高可用的存储服务。 ∙ 更智能:提供数据的生命周期管理与数据的智能处理能力,有效满足企业需求。

- 产品功能:
数据迁移: 支持 PB 级的在线、离线迁移方案,完成中国互联网首个单客户百 PB 级数据的 迁移上云案例,提供更安全、更快速的海量数据迁移上云方案。
∙ 离线数据迁移:闪电立方可将用户线下数据,安全、高效的迁移至对象存储 OSS, 提供端到端的加密机制,支持 TB 到 PB 级数据迁移上云。
∙ 在线数据迁移:用户可使用阿里云 OSS 在线数据迁移服务、OSSImport 工具,将第三方云存储、自建的线下存储等各类数据,在线迁移至对象存储 OSS。
∙ HDFS 数据迁移:通过 Hadoop 对阿里云 OSS 的支持,用户便可以在自建的 Hadoop 集群或通过阿里云 EMR,将 HDFS 中大规模的数据迁移至对象存储 OSS。

数据处理:支持图片、文档、视频、CSV 等数据的常用处理和分析能力,提供更智能的对象存储。
∙ 图片处理:支持 jpg、png、bmp、gif、webp、tiff 等多种格式的转换,及缩略 图、剪裁、水印、缩放等操作。
∙ 视频截帧:支持截取视频中的指定位置生成图片,完成视频截帧。
∙ 人脸识别:支持图片中多张人脸位置与属性检测,如性别、年龄、情绪、头部姿势、眼睛状态、模糊度等。

数据管理:支持生命周期、镜像回源、更丰富的数据上传与下载方式、事件通知、回调等 功能,提供更简单易用、更便于管理的对象存储。
∙ 生命周期:可定义数据的生命周期,将符合规则的对象转换存储类型或过期清除。
∙ 镜像回源:支持配置用户源站,当访问数据不在 OSS 时,OSS 会从源站拉取并写
∙ 传输加速:阿里云 OSS 原生加速产品,依托阿里云数据中心全球的接入点,结合智能探测与调度算法,提供最适合 OSS 用户的加速服务。

容灾备份:通过数据跨区域复制以及同城冗余、版本控制等技术,保障数据的高可靠性, 防止数据被误删或误覆盖导致的业务损失。
∙ 跨区域复制:提供跨不同的 OSS 存储空间之间自动、异步(近实时)的文件复制 能力,将对象的增、删、改等操作进行自动复制。
∙ 版本控制:将数据覆盖和删除操作通过历史版本的形式保存下来。在错误覆盖或者 删除对象后,能够将存储空间中存储的对象恢复至任意时刻的历史版本。
∙ 同城冗余:阿里云 OSS 采用多可用区(AZ)的冗余机制,将数据分散存放在同一 地域(Region)的 3 个可用区。当某个可用区不可用时,仍然能够保障数据正常访问

**安全合规:**OSS 提供多种保证数据安全与合规的技术,包括防盗链、数据存储加密和数据 的合规保留策略(WORM)设置等。
∙ 防盗链:通过设置 Referer 白名单的方式限制仅白名单中的域名可以访问您存储空 间内的资源。
∙ 数据加密:阿里云 OSS 的数据加密功能,提供服务端加密、客户端加密等多种数 据加密选项。
∙ WORM:阿里云 OSS 支持 WORM 策略(一次写入,多次读取),保护周期内,任 何人都不能对文件进行修改以及删除,满足行业合规要求。

2、块存储

- 产品介绍
块存储 EBS(Elastic Block Storage)是为云服务器 ECS 提供的低时延、持久性、高可靠 的块级随机存储。块存储支持在可用区内自动复制您的数据,防止意外硬件故障导致的数 据不可用,保护您的业务免于硬件故障的威胁。

- 产品优势
∙ 数据持久性:云盘基于多副本机制,提供 9 个 9 的数据持久性。
∙ 极致性能:ESSD 云盘最高可提供 100 万随机 IOPS,4000MB/S 吞吐。
∙ 弹性扩展:单盘最大支持 32TB,容量和性能均可弹性扩展。
∙ 安全合规:所有云盘以及快照均支持加密,满足合规要求。

- 产品功能

丰富的块存储产品类型:提供 ESSD AutoPL 云盘、PL1/2/3 云盘、SSD 云盘、高效云盘、 NVMe SSD 本地盘、SATA HDD 本地盘等多种磁盘类型,满足不同业务场景需求。
∙ 弹性扩容:单盘最大支持 32TB,可根据业务负载自行配置云盘容量以及类型,后 续可按需在线扩容以及调整云盘类型,以满足业务诉求。
∙ 数据加密:通过阿里云密钥管理服务(KMS),针对云盘以及快照提供 BYOK 加密能 力。加解密操作对于业务性能基本无损。
∙ 分布式多副本机制:基于分布式多副本技术,为云盘提供稳定、高效的数据随机访 问能力,规避底层单一硬件故障带来的数据丢失问题。

多元的企业级块存储特性:提供云盘加密、弹性扩展、共享挂载、在线变配等传统企业级 SAN 存储特性,满足线下业务无缝迁移上云。
∙ 弹性扩容:单盘最大支持 32TB,可根据业务负载自行配置云盘容量以及类型,后 续可按需在线扩容以及调整云盘类型,以满足业务诉求。
∙ 数据加密:通过阿里云密钥管理服务(KMS),针对云盘以及快照提供 BYOK 加密能 力。加解密操作对于业务性能基本无损。
∙ 分布式多副本机制:基于分布式多副本技术,为云盘提供稳定、高效的数据随机访问能力,规避底层单一硬件故障带来的数据丢失问题。

极致的云盘性能:ESSD 云盘是阿里云目前性能强劲的企业级云盘规格,基于新一代分布 式存储架构,提供单盘高达 100 万的随机读写和低至百微秒的单路时延能力。
∙ 百微秒时延:采用全新架构的 ESSD 系列云盘最低能够提供百微秒写时延,可满足高性能数据库负载。
∙ 单盘最高提供 100 万 IOPS:ESSD PL3 规格最高提供 100 万 IOPS 以及 4000MB/S 吞吐能力,能满足核心交易系统、自建数据库等重 IO 密集型场景。
∙ ESSD 性能变配,秒级生效:ESSD PL1/2/3 规格云盘修改性能等级秒级生效,业务无需等待。

简单高效的数据备份能力:通过自动快照策略或者手工方式针对 ECS 实例、云盘创建快照, 以应对数据丢失或错误风险。同时利用快照能力可实现批量快速创盘。
∙ 批量创建云盘:基于新一代快照服务架构,可实现短期内批量创建 ECS 实例或者 数据盘,实现业务快照部署。
∙ 快照极速可用:启用了“快照极速可用”能力的快照能够在数秒内完成快照创建或 者回滚操作。可将业务等待时间缩短至秒级别。
∙ 快照跨地域复制:通过手工或者自动快照策略,将快照复制到指定区域,可实现云 上异地容灾或者新业务快速开服。

3、文件存储
1)NAS

- 产品介绍
阿里云文件存储 NAS(Apsara File Storage NAS)是一个可大规模共享访问,弹性扩展的 高性能云原生分布式文件系统。支持智能冷热数据分层,有效降低数据存储成本。广泛应 用于企业级应用数据共享、容器、AI 机器学习、Web 服务和内容管理、应用程序开发和 测试、媒体和娱乐工作流、数据库备份等场景。

- 产品优势
∙ 企业级稳定性:基于分布式架构,提供 11 个 9 数据持久性和 99.95%的服务可用 性。
∙ 云原生:存储容量随业务的写入或删除动态伸缩,0 成本创建文件系统,无需提前 预购容量。
∙ 简单易用,快速部署:全托管式服务,控制台界面快速创建和配置文件系统。
∙ 数据分层:通过生命周期实现 NAS 存储的冷数据自动迁移至低频介质,大幅降低 数据存储成本。

- 产品功能
云原生共享文件存储:通过 NFS/SMB 协议为弹性计算 ECS 和容器 ACK 实例提供跨 AZ、 区域和 VPC 的分层目录结构文件访问,支持数千个共享访问链接。
∙ 多协议支持:提供标准的 NFS v3/v4.0 和 SMB 访问协议,支持主流的 Linux 和 Windows 操作系统直接挂载。
∙ 完全托管&动态弹性:提供简单的界面,可以快速创建和配置文件系统,为您管理 文件存储软硬件基础设施,根据应用所需,动态提供存储容量和性能。
∙ 面向应用的数据共享:与容器 ACK 服务深度整合,为容器环境提供数据共享和数 据持久化存储,并通过高性能文件锁保证数据的强一致性。

多种存储类型:拥有通用型和极速型两种针对特定场景的 NAS 存储产品,以及超高性能的 CPFS。通用型 NAS 支持数据冷热分层,提供更具性价比的存储方式。
∙ 面向不同场景的通用型、极速型和 CPFS:通用型 NAS 满足数据共享、高吞吐的常 规需求。极速型 NAS 的低延迟和快照技术,为 Devops、金融业务提供专属优化。 CPFS 可以满足 AI、HPC 最严苛的 I/O 要求。
∙ 从热到冷多种规格:通用型 NAS 提供性能型、容量型两种规格,结合低频介质满 足不同场景下对存储的性能和成本需求。
∙ 数据生命周期:支持配置基于访问时间的自动转储规则,将数据转储至低频介质, 大幅降低存储成本。低频介质上的数据可以在文件系统中随时访问。

企业级数据管理:提供配额管理、AD\ACL 权限控制、容量和性能监控等企业用户需要的 高级数据管理功能。
∙ 配额管理:支持对某个目录设置某个用户或用户组的空间和文件数配额,保障多部 门多应用间资源合理使用。
∙ 容量和性能监控:对接云监控,支持 NAS 基础服务指标、性能指标和计量指标的监控。及时了解服务运行情况。
∙ AD\ACL 权限控制:支持接入 AD 域控,对域用户进行文件或目录的 ACL 访问权 限控制。保障企业内多部门间的数据安全访问。

企业级数据保护:提供权限组 IP 隔离、数据加密、数据备份等企业用户需要的高级功能。
∙ 权限组:支持基于计算实例的 IP 地址或网段配置文件系统读写权限规则,实现不 同业务或部门间的数据隔离。
∙ 数据加密:提供服务端加密、传输加密,构建全链路数据加密能力,保障端到端数 据安全。
∙ 数据保护:支持回收站,有效防止数据误删。与云备份 HBR 服务深度整合,支持 灵活的备份策略,周期性自动备份和增量备份。

2)CPFS(Cloud Paralleled File System)

- 产品介绍
文件存储 CPFS (Cloud Parallel File Storage)是阿里云完全托管、可扩展的并行文件存储 系统,支持 POSIX\MPI-IO 和 NFS 协议,针对 GPU 和 CPU 计算场景进行了深度优化,提 供对数据亚毫秒级的访问和百万级 IOPS 的数据读写请求,可以用于 AI 深度训练、自动驾 驶、基因计算、EDA 仿真、石油勘探、气象分析以及影视渲染等业务场景。

- 产品优势

∙ 与 OSS 数据湖融合:支持高速导入 OSS 数据与元数据,为 OSS 提供高速文件访 问能力。
∙ 高吞吐和超高 IOPS:采用分布式并行架构,基于全闪介质提供数十 GB 吞吐和百 万级 IOPS。
∙ 简单易用:30 分钟创建高性能文件系统,支持 POSIX、NFS 协议互访。
∙ 弹性可扩展:支持在线扩容,可快速实现线性增长,满足更多容量与性能诉求。

- 产品功能

高性能计算文件存储:支持标准的 POSIX、MPI-IO、NFS 协议,高性能计算程序无需进行 任何接口适配和性能优化即可高效率执行。
∙ 兼容POSIX/MPI/NFS:兼容标准POSIX/MPI-IO/NFS协议,高性能应用程序无需 进行任何更改,即可直接通过 ECS 或容器 CSI 接口连接 CPFS 读写数据。
∙ 高吞吐,低延时:新一代并行架构,用户 I/O 在客户端和存储节点间完全并行访 问,通过集群聚合,吞吐可以线性增加。同时基于全闪 SSD 介质,提供亚毫秒级 时延。
∙ 并发访问优化:元数据和数据均采用分布式的并行架构,无惧小文件,支持百万级 IOPS,几千台服务器同时并发访问,适合 GPU 多机多卡训练。

与阿里云计算生态密切整合:与 E-HPC、容器 ACK、无影等计算平台整合,支持方便的挂 载 CPFS 文件系统。用户可以在云上分钟级构建高性能计算和分析平台。
∙ 与 E-HPC 深度整合:通过 E-HPC 控制台可以快速创建 CPFS 文件系统并搭建完整 的高性能计算平台。
∙ 支持容器 ACK CSI 接口:CPFS 支持阿里云 ACK 容器服务。通过 CSI 接口,容器服 务可以方便的利用 CPFS 的高速 I/O 能力。同时实现计算力大规模弹性伸缩。
∙ 支持无影云桌面:CPFS 通过 NFS 协议服务支持无影桌面直接挂载。实现开发调试终端与高性能运算集群的数据共享。

混合云高性能计算文件存储:支持标准的 POSIX 和 MPI-IO 协议,高性能计算程序无需进 行任何接口适配和性能优化即可高效率执行。
∙ 兼容 POSIX/MPIIO:兼容标准 POSIX/MPI-IO 协议,基于 Linux POSIX 和 MPI-IO 编程的高性能应用程序,无需进行任何更改,即可直接运行。
∙ 高吞吐,低延时:依靠并行架构,用户 I/O 在客户端和存储节点间完全并行访问, 通过集群聚合,吞吐可以线性增加。
∙ 丰富企业级特性:拥有 ACL/Quota/快照等企业级数据管理能力。

3)HDFS(Apsara File Storage for HDFS)

- 产品介绍
阿里云文件存储 HDFS 版(Apsara File Storage for HDFS)提供标准的 HDFS 访问协议, 用户无需对现有大数据分析应用做任何修改,即可使用具备无限容量及性能扩展、单一命 名空间、高可靠和高可用等特性的分布式文件系统。
- 产品优势
∙ 易使用:允许像在 Hadoop 分布式文件系统(HDFS)中一样管理和访问数据。
∙ 高性能:高吞吐、高 IOPS,全面满足大数据分析的性能需求。
∙ 高可靠:基于多副本技术,可靠性不低于 99.999999999%。
∙ 低成本:弹性伸缩,降低数据分析业务整体 TCO。

- 产品功能
高性能、高可靠、高可用:基于阿里云新一代分布式存储和高速网络。
∙ 高性能:基于阿里云新一代分布式存储和高速网络,提供大数据分析所需的高吞吐 能力。
∙ 高可靠:基于分布式多副本技术,99.999999999%的数据可靠性设计,提供远高 于传统 HDFS 存储的可靠性。
∙ 高可用:基于全分布式设计,所有节点无单点问题,提供高于 99.9%的可用性。

海量、弹性的存储空间:存储空间按需使用。
∙ 海量存储空间:单个文件系统存储空间无上限。
∙ 弹性扩展的多层命名空间:单个文件系统的元数据能力随存储空间线性扩展。

简单、易用的使用方式:兼容 HDFS 接口,您的 Hadoop 应用无需修改即可上云。
∙ 简单、易用:提供标准 HDFS 接口,无论 Hadoop 还是机器学习应用,无需任何 修改,即可使用文件存储 HDFS。
∙ 原子目录操作:提供高性能元数据操作能力,移动、重命名、删除即刻完成,提升 大数据分析效能,降低整体 TCO。

强大、稳定的安全机制:RAM 用户认证、VPC、安全组的访问控制,保障数据安全。
∙ 网络隔离:支持通过 VPC 链路层数据传输和访问隔离。
∙ RAM 用户认证:支持主子账号授权,满足大型企业复杂授权模型。

4、日志服务

- 产品介绍
日志服务(SLS)是云原生观测分析平台,为 Log/Metric/Trace 等数据提供大规模、低成 本、实时平台化服务。一站式提供数据采集、加工、分析、告警可视化与投递功能,全面 提升研发、运维、运营和安全等场景数字化能力。

- 产品优势
∙ 统一接入:Log/Metric/Trace 数据统一接入;全面支持云产品日志、开源系统、 多云日志、云下日志接入。
∙ 智能高效:具备秒级分析百亿级数据能力;支持完整 AIOps 能力,支持智能异常 检测与根因分析。
∙ 一站式:支持采集、加工、分析、可视化、告警等一站式日志功能;全面兼容 Flink, Spark 等流批数据分析平台。
∙ 弹性低成本:具备 PB/Day 规模弹性伸缩能力;支持按量付费,仅需为实际用量 付费,TCO 降低 50%以上。

- 产品功能
数据采集:支持 Log/Metric/Trace 统一采集,支持服务器/应用/移动设备/网页/IoT 等数 据源接入,支持阿里云产品/开源系统/云间/云下日志数据接入。
∙ 便捷:40+成熟接入方案,多客户端统一采集,支持内网、公网、全球加速传输等多种传输方式。
∙ 可靠:阿里经济体自用基础设施,历经多次双十一,春晚活动考验。支持断点续传,
可根据业务流量实现弹性伸缩。
∙ 开放:多协议(HTTP/Syslog/Prometheus/OpenTelemetry)无缝接入,完整对
接开源生态。

数据加工:通过灵活语法,在不编写代码情况下支持各种复杂数据提取、解析、富化、分 发等需求,支持结构化分析。
∙ 灵活:提供丰富算子、开箱即用的场景化 UDF(Syslog、非标准 json、AccessLog UA/URI/IP 解析等)。可扩展语法应对各种复杂格式。
∙ 免运维:全托管云上服务,无须投入额外运维资源。支持自动根据流量弹性伸缩。
∙ 可扩展:支持多层嵌套、分流等逻辑,支持复杂的数据分派与编排需求。

查询分析:提供关键词、SQL92. AIOps 函数等多种方式,支持面向文本+结构化数据实时 查询分析,异常巡检与智能分析。
∙ 高性能 :秒级分析十亿级数据,且完整支持 SQL、PromQL 等分析接口,HTTP、 Kafka、JDBC、Prometheus 等协议。
∙ 稳定可靠:企业级设计,多租户隔离,PB 级容量设计,数万企业用户选择。
∙ 智能:经过阿里经济体实践的 AIOps 能力,支持智能异常巡检与根因分析。

监控与告警:具备丰富的可视化组件,可创建所见即所得的交互式分析大盘。同时支持实 时可编排的告警功能,可随时随地掌握业务动向。
∙ 一站式:丰富的可视化组件,可交互式分析报表,灵活告警与多样的通知能力。
∙ 灵活:支持灵活监控规则编排,告警策略管理,行动策略管理及多样化通知渠道。
∙ 开放:支持 JDBC/HTTP 等多种查询协议,支持多种可视化标准。

日志审计:多账户下实时自动化、中心化采集云产品日志并进行审计,支持升级所需合规 存储、查询及信息汇总报表。
∙ 自动化:一键式配置,支持 30+ 种数据源自动接入,跨多主账号自动实时发现新 资源并实时采集。
∙ 合规性:满足合规、等保、网安法、GDPR 等多种标准,内置近百个安全合规监控规则,一键式开启。
∙ 开放:提供 20+种数据对接手段,与开源、阿里云大数据、第三方 SOC 软件无缝对接,充分发挥数据价值。

投递与消费:与各种实时计算及服务实时对接,并可以实现自定义消费。支持数据投递至 存储类服务,支持压缩、自定义 Partition 以及行列等各种存储格式。
∙ 稳定可靠:PB 级容量设计,根据流量变化自动弹性伸缩,提供任务状态监控及异 常告警。
∙ 免运维:开箱即用免运维,无需编写代码,仅需控制台简单配置即可完成任务配置。
∙ 开放:提供 20+种数据对接手段,无缝对接主流(Flink、Spark 等)流计算、数据
仓库平台与阿里云众多产品。

5、表格存储

- 产品介绍
表格存储(Tablestore)面向海量结构化数据提供 Serverless 表存储服务,同时针对物 联网场景深度优化提供一站式的 IoTstore 解决方案。适用于海量账单、IM 消息、物联网、 车联网、风控、推荐等场景中的结构化数据存储,提供海量数据低成本存储、毫秒级的在 线数据查询和检索以及灵活的数据分析能力。

- 产品优势
∙ Serverless:弹性支持单表 PB 级存储,自动扩展服务能力,享受免运维、即开即 用的使用体验。支持多级存储介质,配合冷热自动分层最大化优化存储成本。
∙ 场景化数据模型:针对场景化优化提供多种数据模型,包括宽行模型、时序模型和
消息模型。简化数据模型定义,让开发更便捷,让能力更贴合。
∙ 多元化索引:可便捷的对数据进行实时索引,针对不同查询场景提供多元化索引。
支持二级索引、全文索引和多维数值索引,加速查询与分析。
∙ 易集成生态丰富:全面接入开源与云原生大数据生态体系。与 Maxcompute、
Spark、Flink 等计算引擎集成,与 Kafka、数据集成等链路组件无缝打通。

- 产品功能

Serverless:提供 Serverless 服务体验,零运维,低成本。
∙ 分布式架构体系,自动负载均衡:单表 10PB 级数据量、万亿条记录数以及千万级 别的 TPS 能力。自动负载均衡及热点迁移,无需人工介入。
∙ 存储计算分离,多种存储介质:存储计算分离架构,计算层与存储层均可独立扩展, 更灵活更低成本。支持多级存储介质,配合冷热自动分层最大化优化存储成本。
∙ 支持灵活计费模型:支持纯按量模式,享受 0 元门槛产品使用。同时支持预留模式,规划预留资源、成本可控。灵活选择满足不同场景需求。

企业级服务,稳定安全:多维度、多层次的安全防护与访问控制,保障数据安全。
∙ 企业级安全保障体系:提供表级别和 API 级别的权限管理机制,支持 STS 临时授 权和自定义权限认证及主子账号功能。同时提供网络访问控制能力与数据加密能 力。
∙ 数据高可靠:数据多副本,保证强一致性,按照 11 个 9 的数据可靠性的标准设计。 同时支持通过 HBR 来做数据备份与恢复。
∙ 服务高可用:分布式存储架构,单点故障快速检测快速恢复,按照 99.99%可用性设计。

场景化数据模型:能够满足不同场景不同类型数据存储。
∙ 宽行数据模型:无需结构定义,属性列能够灵活动态扩展。适用于非强事务、海量 在线数据存储与查询。
∙ 时序数据模型:针对时间序列数据的特点进行设计,提供更高压缩比,支持数据查 询与分析。适用于物联网设备监控、设备采集数据、机器监控数据等场景。
∙ 消息数据模型:针对消息数据场景所设计,能够满足消息数据场景对消息保序、海 量消息存储、实时同步的特殊需求。可以同时应用在 IM、Feed 流等消息场景中。

多语言 SDK 与 SQL 灵活访问:支持 SQL、ResultAPI、SDK、客户端等不同访问方式。
∙ SQL:支持 SQL 查询。能够映射关联不同数据模型的表,能够自动关联索引进行 查询与分析优化。
∙ 多语言 SDK:Restful API 接口,多语言 SDK 支持,满足不同语言开发者的使用需求。
∙ 开发工具:支持客户端与命令行工具,支持 Windows、Linux 和 Mac 平台。能够
便捷的完成所需的运维管理需求。

数据检索与分析:提供多元化索引,满足不同场景数据查询与分析需求。
∙ 多元索引:提供二级索引、全文索引、多维数值索引等多种数据索引。提供不用场 景的查询与分析加速。
∙ 查询加速:支持任意字段的组合查询、全文检索、地理空间查询、模糊查询等能力。 加速数据查询。
∙ 分析加速:内置统计聚合能力,支持高并发扫描与存储侧算子下推,加速数据分析。

开放的计算生态对接:全面接入开源与云原生大数据生态体系以及数据链路中间件。
∙ 计算引擎对接:支持 Maxcompute、Spark、Flink 等计算引擎直接访问。
∙ 数据实时订阅:能够实时捕获表内数据的变化,提供全增量一体数据实时订阅能力。
可以自定义数据实时处理或对接流计算引擎。
∙ 上下游数据集成:与 Kafka、数据集成等链路组件无缝打通,便于多组件数据架构搭建。同时支持数据实时投递至 OSS,搭建数据湖架构。

6、云定义存储CDS

- 产品介绍
云定义存储(Cloud Defined Storage,CDS)通过盘古全新的 QoS 框架将对象存储 OSS、 块存储 EBS、日志服务 SLS 和灾备服务 HBR 多个存储产品融合部署在同一套物理服务器 上,与公共云上规模化的存储服务做到了代码版本基本一致,弥合了以往混合云版本和公 共云版本差距较大的问题。

云定义存储是一个全新的软件定义存储,既能够在定制的存储服务器上软硬一体优化输出, 也支持 x86 服务器到各平台的软件输出模式。其中最核心的关键词是“云定义”,具有云原生(Cloud Native)、云规模(Cloud Scale)、云服务(Cloud Service)、云连通(to Cloud)、 云部署(on Cloud)以及混合多云(Hybrid Multi Cloud)等优势。

- 块存储技术能力

云定义存储提供了数据块级别的随机存储 CDS-EBS,具有低时延、强持久性、高可靠等特点,采用 CDS-EBS 依托于盘古提供的异步写、后台读等能力,可提供稳定的时延和故障恢复能力。

CDS-EBS 在云盘调度和 QoS 等方面经过充分优化,可保持服务器之间和云盘之间流量公平 分配,保证用户稳定的体验。CDS-EBS 会经过严格的故障切换测试和破坏性测试,可在进 程挂掉、机器宕机、物理盘损坏、单机网络故障等场景做到业务流量平稳,同时管控节点 宕机可做到持续服务,热升级可做到用户无感知。

CDS-EBS 提供全链路 CRC 校验能力,可有效校验出 I/O 传输过程中的网络、CPU、内存错 误,不会将错误数据返回给用户。同时针对内部一些逻辑如纠删码、压缩、TRIM 进行额外 的算法维度的校验,确保纠删码、压缩和 TRIM 算法不会导致数据错误。

CDS-EBS 会针对冷数据进行后台扫描,除了物理介质上存储的数据 CRC 校验外,还包括数 据读上来之后进行文件格式解析、解压后的校验,以及副本间数据一致性的校验,经过优 化,绝大部分场景可保证 60 天内完成一轮整集群粒度的数据扫描。

CDS-EBS 集群规模相比公共云要小很多,最小支持 6 台服务器集群,目的是降低起建规模, 节省用户成本。CDS-EBS 会在单台服务器上混合部署不同服务,如元数据服务节点、数据 存储节点等,各服务之间设置了严格的 CPU 和内存的隔离,经过了严格测试可保证有限资 源下业务平稳运行。

CDS-EBS 同时针对各服务间做了软件架构上的 QoS 隔离以及优先级控制,保证各服务在使 用飞天盘古文件系统时不会相互干扰。在 CDS-EBS 与 CDS-OSS 混部场景,同样支持不同 业务间的资源隔离,确保不同业务的吞吐、空间和性能规格。CDS-EBS 从性能、产能、稳 定性、运维、监控告警等方面重新定义了小型化的基线,以更好地适配云定义存储场景。

- 对象存储技术能力

对象存储架构从上到下主要分为三层:对象语义服务层 Service Layer(Service Layer)、索 引服务层 (KVLayer)和存储持久层,具有如下特点:
∙ 领先的松耦合分布式架构:对象存储各个层次的功能松耦合而且是全分布式系统,全分 布式服务使得架构没有单点故障,解耦架构使得各个层次可以单独灵活扩展,以便支持海量文件存储。

∙ 高可靠性和高性能:对象存储在接入点时根据负载均衡没有热点负载,而且无状态支持 快速故障切换,索引层根据字典序打散服务,根据热点自适应均衡,数据在持久层按块的粒度全打散副本/纠删码备份,故障后数据并发重建,快速恢复数据冗余,保证数据 可靠性。各层解耦使得性能可以提高线性扩展能力,而且充分利用固态硬盘的能力实现 分层存储加速,应对海量文件也能做到高可靠和高性能。

- 日志服务技术能力
为了更好地解决存储系统与业务系统的运维问题,云定义存储引入了基于阿里云日志服务 SLS 构建的可观测能力,即 CDS-SLS。CDS-SLS 致力于超大规模的 PB 级日志数据的计算存储,并针对偏计算和偏审计等场景推出专门的机型,更加灵活满足线下用户的需求,将计算和存储资源利用得更加充分。

CDS-SLS 秉承"提供机制而不是策略(Separation of Mechanism and Policy)"和“单一 职责(Do One Thing and Do It Well)”的经典 UNIX 思想,各模块中有大量的后台参数可以调节,默认值能够满足大部分业务场景的需求。

**CDS-SLS 的数据采集 Agent(Logtail)**经过多年百万机器大规模验证,在性能、稳定性上 都有很好的保证,相比开源软件,可以大幅降低对机器资源的占用,最高可降低 90%。

同时针对云原生场景 Logtail 和 Telegraf 深度集成,针对常用中间件 Nginx、MySQL、 MongoDB、Kafka 的监控数据采集到 SLS 进行查询分析。针对线下数据中心场景,通过 Syslog 和 SNMP 方便地将硬件网络设备的日志接入分析告警,有效提高运维效率和可视化大盘信息。

7、云灾备
1)混合云备份(Hybrid Backup Recovery)

- 产品介绍
混合云备份 HBR(Hybrid Backup Recovery)作为阿里云统一灾备平台,是一种简单易用、 敏捷高效、安全可靠的公共云数据管理服务,可以为阿里云 ECS 整机、ECS 数据库、文件系统、NAS、OSS、Tablestore 以及自建机房内的文件、数据库、虚拟机、大规模 NAS 等提供备份、容灾保护以及策略化归档管理。

- 产品优势

∙ 经济:对比自建灾备系统,节约 80%以上 TCO。

∙ 高效:数据重删压缩比高达 30:1,节约网络、存储资源。

∙ 安全可靠:AES-256 / KMS 加密备份数据,定期数据校验检查。

∙ 免运维:主动监控状态,出错自动告警。

- 产品功能

数据源丰富:支持阿里云上应用数据和本地数据中心等多种数据源备份。
∙ 阿里云上应用数据:支持 ECS (文件,MySQL, Oracle, SQL Server,SAP HANA), NAS, OSS,Tablestore 等阿里云上数据源备份。

∙ 本地数据中心:支持文件,NAS,VMware,主流数据库等本地数据源备份。

∙ 其他公共云 :可以为其他云服务商上的文件提供备份服务。

经济高效:备份上云,灵活扩展,省存储,省网络。
∙ 领先的重删能力:备份数据重删比可达 30:1, 节约备份存储的消耗。

∙ 网络流量小:本地文件永久增量备份,源端重删,全量备份也无惧流量限制。

∙ 免费的高级功能:本地虚拟机云上恢复功能无需额外付费。

简单易用:云原。生服务,学习曲线几乎为 0。
∙ 本地纯软部署:简易客户端安装,备份策略一键配置。

∙ 云上一键启用:无需手动安装客户端即可备份 ECS,NAS, OSS,Tablestore,集中控制台统一操作。

∙ 运维全自动:备份策略自动执行,出错短信、电话、邮件多渠道告警,免运维。

备份容灾归档迁移一体化:本地 NAS 系统备份、归档上云;本地 VMware 备份、容灾、 迁移上云;ECS 备份、容灾一体化。
∙ 本地 NAS 系统备份、归档上云:本地 NAS 系统海量文件智能分析,多维度展现数 据特点,热数据备份,冷数据策略化归档,预测数据管理效果。全局检索,秒级发现归档文件。

∙ 本地 VMware 备份、容灾、迁移上云:本地 VMware 虚拟机无代理增量迁移,适 合核心生产系统批量上云;支持 LAN 模式与 LAN-Free 模式的 VMware 无代理备 份上云,可 on-demand 恢复至 ECS,实现本地系统云容灾。

∙ ECS 备份及 ECS 整机跨地域/可用区容灾:ECS 文件、数据库备份;ECS 整机跨地 域/可用区高性能容灾,支持动态增盘、扩盘,实现备份及容灾双重保护

2)混合云容灾(Hybrid Disaster Recovery)

- 产品介绍
混合云容灾 HDR(Hybrid Disaster Recovery) 是为企业级应用提供低至秒级 RPO 和分钟级 RTO 的容灾服务。覆盖本地应用容灾上云,阿里云上应用跨可用区或跨地域容灾场景, 可以有效保障数据安全和业务连续性。无需自建灾备中心,云下部署简单、云上资源全自动管理、控制台集中管控。

- 产品优势
∙ 高性能:秒级 RPO,数据实时复制,分钟级 RTO,云上快速整机拉起。

∙ 可验证:一键演练,10 分钟完成验证,多恢复点,可验证历史版本。

∙ 低成本:免机房建设,云上只需极少数计算资源。

∙ 易运维:无需部署云主机,全链路监控,故障自动报警。

- 产品功能
高性能 CDR:满足高 RPO、RTO 要求的持续数据复制。
∙ IO 级实时复制:每个 IO 操作秒级上云,数据丢失量小。

∙ 快速整机恢复:几分钟内云上整机拉起,业务快速恢复。

∙ 一致性能:任意恢复点演练以及容灾切换,都保持分钟级 RTO。

集约化配置:容灾资源消耗远小于生产站点。
∙ 极低计算资源:无需对等配置计算资源,平时仅消耗云盘和极少量计算CPU内存。

∙ 容灾网络无消耗:云上 VPC,vSwitch,流量完全免费。

∙ 无需自建灾备中心:无需自建灾备中心,免去机房运维、硬件采购等成本。

一键式操作:容灾操作一键完成。
∙ 一键演练,一键切换:最短 2 分钟内整机拉起,满足快速演练,快速容灾切换需求。

∙ 多恢复点:直观选择历史恢复点,一键拉起 RTO 恒定。

∙ 全自动管理:云下部署简单、云上资源全自动管理、控制台集中管控。

8、闪电立方

- 产品介绍
闪电立方(Datatransport)能够为用户提供安全、高效、便捷的数据传输服务。支持将对象存储、文件存储从不同设备、不同云服务商迁移和同步到阿里云。它提供在线迁移和离线迁移(闪电立方)两种迁移方式,致力于解决大规模数据传输效率、安全问题等难题。

微型闪电立方作为闪电立方的小型化设备,具有超强的抗震、宽温能力,可运行在自动驾 驶、媒体、医院、工厂、影院等多个边缘数据迁移场景,让数据迁移更简单,更高效。

- 产品优势
易用灵活:迁移过程实时监控,在线显示迁移进度;迁移结果提供报告,完成情况一目 了然;支持可视化配置页面,仅需 3 步设置部署任务。

安全可靠:传输时,采用 HTTPS 数据加密通道;支持 MD5 或 CRC 自动识别源端校验 规范,进行读写双向校验。

部署方便:为数据迁移而生的专业设备,标准机架和电源,可多套同时部署提升迁移效 率;支持多种的数据源类型:本地文件系统、NAS、HDFS、FastDFS 等。

安全可靠:采用 CRC 技术对读写双向校验保障数据一致性;提供端到端的加密机制运 输并上传数据;数据迁移完毕后,通过阿里云官方数据擦除机制,确保数据不会被第三 方获取。

- 产品功能
支持热迁移,降低系统迁移过程中的应用停机时间。可实现不停服热迁移,存量数据迁移 完成后,配合使用增量数据迁移功能,定时扫描增量将数据迁移到阿里云目标数据源中, 可以将系统迁移过程中的应用停机时间降低到秒级别。

完善的迁移监控可视化平台,无运维成本。
∙ 迁移过程监控:支持迁移进度查询,迁移流量数据监控。
∙ 迁移任务报告:支持迁移完成率统计,打印失败文件列表清单。
∙ 灵活的迁移管控:支持随时启停迁移任务,动态修改迁移限流,重试失败任务。
支持图形化管理。提供图形化的配置界面,用于用户登录设备,进行网络、数据迁移任务 和迁移参数的配置。

从本地机房到阿里云:
∙ 第 1 步:选择闪电立方机型,并下单;
∙ 第 2 步:设备邮寄到用户机房,上传数据;
∙ 第 3 步:设备邮寄回阿里云指定机房,传输数据上云。

9、智能媒体管理

- 产品介绍
智能媒体管理 IMM(Intelligent Media Management)是一款场景化封装数据智能分析 管理工具。为云上的文档、图片数据,提供一站式数据处理、分析、检索等管控体验。根 据图片分析、数据存储等不同应用场景,封装整合完整的处理能力,让数据快速流转。

- 产品优势
存储数据无缝贴合:与对象存储 OSS 等存储产品直接关联绑定,自动处理云上数据。

无需运维:提供 Serverless 化服务,无需关心业务运维。
∙ 丰富数据处理:具备业界强大识别、处理能力,为应用提供数据处理、分析、检索等支持。

一站式解决方案:面向场景构建快捷的元数据管理,快速实现应用。

- 产品功能
文档格式转换、预览:支持共48种文件类型不同办公文档的格式转换与预览,帮助 用户搭建文档内容中心。

图片内容识别:支持 25 个主标签,上千个子标签,图片场景快速添加标签,帮助 图片内容管理。

人物识别、聚类:支持照片的人物识别与聚类,能够为照片添加人物维度属性,帮助快速查找人物。

OSS 云存储整合:支持通过 OSS 文件的 URL 直接进行数据处理分析,用户无需 额外开发即能让 OSS 文件支持文档预览。

10、网盘与相册服务

- 产品介绍
网盘与相册服务(Drive&Photo Service)包含企业版和开发者版本,是为客户提供的面向 企业、团队与个人的数据管理开放平台,提供一站式数据存储、分析和 AI 的能力。方便客 户快速高效的构建可支撑海量用户的网盘与相册服务,同时针对团队及个人用户,支持免 开发开箱即用。
- 网盘与相册服务企业版产品优势
集中管理,高效协同:开箱即用,实时同步最新文件,用户在电脑、手机都可以获取最 新文件。

360°权限管理:灵活的权限管理,支持团队、企业、集团公司各分支组织配置不同权限。

多重安全防护:依托于阿里云高安全防护水位,符合国家信息安全等级保护制度要求。

可定制化:定制企业名称、logo,打造企业专属风格。

- 网盘与相册服务企业版产品功能
多种文件管理功能:统一存放和管理企业重要的文件资料,提供各类文件增删改查功能, 符合用户在本地电脑管理文件的使用习惯,实现本地与云上无差别管理。

统一存储:提供文件上传下载、新建文件及文件夹、移动、复制、删除、排序、收 藏、备注等一系列的文件管理能力。

在线预览:提供文档、图片、音频、视频等十几种文件格式的预览。

文件检索:支持按照文件名称、文件类型、文件内容等搜索,也支持各种排序方式方便查找文件。

回收站:提供默认保留 90 天的文件回收站功能,90 天内可以恢复文件,90 天后文件自动清除。

应用实践

一、本地数据上云方案

1、数据业务迁移上云方案

1)需求背景
企业为了优化内部资产结构,从原来的重资产模式向轻资产模式转化,以此来节省总体成本。

现有的方式是逐步的淘汰一些到期硬件设备,而采用公共云基础设施(云服务器、云存储) 来取代,这其中会有大量的业务迁移转换工作需要完成,包括数据迁移和应用迁移两种。

数据迁移:是指非结构数据(通常指文件)和结构化数据(通常指数据库数据)迁移;

业务迁移:是指应用程序和系统的迁移。

2)解决方案
针对数据及业务的迁移上云,阿里云主要提供离线迁移和在线迁移两种形式。迁移的过程中还要考虑数据存量和增量的问题。

进行数据存量迁移时,需结合存量数据存储的位置、源端和目标端之间的网络情况、迁移的速度要求等多方面因素,具体解决方案包括:
在这里插入图片描述
存量数据的迁移,一般还会涉及到存量数据的增量数据迁移,即在数据的迁移过程中源端 产生的新数据。这部分新增数据的迁移可使用以下方案:

对象存储镜像回源方式,这种方式适合于互联网音视频数据迁移。

Ossimport,这是对象存储在线迁移服务自带的增量迁移工具,可以指定增量迁移时间间隔等参数。

2、数据归档上云方案

1)需求背景
IDC 数据显示,到 2025 年,全球数据圈将增至 175ZB,其中,企业存储的数据量将超过 全球总数据量的 80%。随着数量的急剧增长,企业陷入非结构化数据溢出的危险境地。问 题不在于企业购置容量来存储全部数据,而是如何以低成本高效率的方式妥善管理数据以 创造商业价值,尤其是长期数据保留。

合规和监管要求并非企业长期保留数据的唯一动力:在英国,互联网服务商必须保留通讯 记录一年以上;在美国,美国联邦有关研究记录的准则规定,研究数据在研究工作结束后 应至少保留三年,《健康保险可移植性和责任法案》要求患者数据至少保留 6 年。

2)解决方案
在数据归档场景中,可选择闪电立方上云做异地备份,如果文件想要自动增量同步上云做 归档的,则混合云存储阵列的云文件网关的云复制功能或云缓存功能是较好的选择。对于 包括医疗影像、科研数据、金融数据、视频素材等海量数据的长期归档,对象存储归档/冷 归档/深度冷归档存储类型也可以实现。此类数据都有一些共同的特性:
∙ 存储周期长,几年、几十年甚至永久;
∙ 实时访问要求不高,读取数据可以接受一定的等待时间;
∙ 对数据安全性、可靠性要求高,某些数据需要符合特定的行业规范要求; ∙ 在整个存储周期内,需要比传统存储解决方案更低的存储单价;

对象存储全面覆盖从有热点存在、频繁访问的各类音视频、图片数据,到低频访问的各类 备份数据,再到长期归档的数据。配合生命周期机制,按照配置的时间周期,将数据转储 到更低单价的存储类型上,优化存储成本。
在这里插入图片描述

方案优势:
∙ OSS 支持标准、低频访问、归档、冷归档、深度冷归档五种存储类型,可以通过生命 周期规则或者 CopyObject 的方式随时转换文件(Object)的存储类型。归档存储类型 API 支持用户直接把需要备份的文件存储到 OSS 归档存储,存储后的文件名称保持不变。
∙ 使用 OSS 归档/冷归档/深度冷归档存储类型,可以降低归档数据的管理难度和相关管 理资源的投入。
∙ OSS 支持多次读取特性,支持以“不可篡改、不可删除”的方式,满足数据合规保存或 防止恶意删除等要求,并获得多项合规认证,满足行业合规要求。

二、云灾备解决方案

1. 需求背景
根据 Gartner 发布的存储战略路线图所示,越来越多的数字化领先企业正在用新的混合云 备份产品替换现有的备份解决方案。
阿里云企业级云灾备解决方案,来自阿里巴巴多年的 IT 基础设施云化灾备经验,采用国内首个磁盘级数据持续复制技术,同时支持混合云和跨云的多平台融合架构,可以为企业提升灾备能力,包括用户数据中心和公共云的相互容灾、业务不停机下企业容灾演练、最低负载部署支持弹性容灾、一键容灾快速恢复、完善数据加密体系,保证数据安全。

2. 解决方案
阿里云正在凭借自身优势,让云上灾备更加行之有效。首先是阿里云高标准的基础设施, 服务器本身具备超强的容灾能力。不断电、不断网,IDC 历史运行可用性达 99.999%。主 要包括不断电的 IDC,高可用的骨干网络,3+N 超多线接入 BGP。其次,在备份和容灾软件上,更是基于自研的飞天盘古存储引擎,实现数据的安全性和业务的高可用,此外,为数据库用户提供完整的灾备能力。

在这里插入图片描述
方案优势包括:
∙ 部署简单:数据保护服务即开即用,可快速建立属于自己的混合云备份库,降低部署复杂度和运维成本。
∙ 云端管控:服务提供资源监控、备份、恢复、元数据搜索、加密、压缩、策略配置、过滤等各项数据保护功能。
∙ 永久增量:文件初次备份后,后续备份自动增量,上云效率非常高。
∙ 重删加密:备份数据经过重删、压缩、加密后存储,高效利用空间,保障安全性。
∙ 多副本:同时通过云上云下数据块比对,混合云备份库提供多副本保留达到 12 个 9 数 据可靠性保障,确保备份数据不出错。

三、云上数据应用解决方案

1. 影视数据存储与传输加速方案

1)需求背景
截至 2022 年底,全国有线电视实际用户数 2.00 亿户;高清和超高清用户 1.10 亿户;智 能终端用户 3745 万户。全国交互式网络电视(IPTV)用户超过 3 亿户,互联网电视(OTT) 平均月度活跃用户数超过 2.7 亿户,短视频上传用户超过 7.5 亿户。全国地级及以上播出 机构经批准开办的高清电视频道 1082 个,4K 超高清电视频道 8 个,8K 超高清电视频道 2 个。电视高清化超高清化进程显著加快。
在上述背景下,影视数据存储与传输加速的问题急需解决。

2)解决方案
影视数据不仅存量基数大、数据增速快,还具备检索实效性弱、存储时间长、数据利用率 低等问题,同时,随着高清影视数据的需求以及地域分布的现实性问题的存在,传输加速 也成为一种刚性需求。
在这里插入图片描述
阿里云对象存储 OSS 不仅可以满足海量非机构化数据的集中存储,而且 OSSBrowser 工具 还可以实现影视数据多用户、多地域分发、汇集以及传输加速。

方案优势:
∙ 跨地域、多角色、分权限文件上传、下载。
∙ 基于对象存储及其客户端实现 Serverless 文件分发服务,可替换传统 FTP 服务。
∙ 利用对象存储传输加速功能,全地域的网络调度、协议优化能力,提升数据交付传输的效率。

2. 物联网大数据存储解决方案

1)需求背景
阿里达摩院发布的《达摩院 2021 十大科技趋势》认为,疫情中数字经济所展现出来的韧性,让企业更加重视工业智能的价值,加之数字技术的进步普及、新基建的投资拉动,这些因素将共同推动工业智能从单点智能快速跃迁到全局智能。

IDC 预测,到 2025 年,全球物联网设备数将达到 416 亿台,产生 79.4ZB 的数据量。在中 国,到 2024 年,由人工智能自动化、物联网和智能设备需求驱动的数据量将超过 30ZB; 20%的业务将利用它实现实时结果。数据将要求更好的实时采集、传输和计算。以自动驾驶为例,1 毫秒延时就可能造成交通事故,对存储提出新挑战。

2)解决方案
ESSD 可以实现数据的快速传输与存储,满足 AIoT 场景下对存储性能、读写时延等方面的 极致要求。其优异的性能得益于阿里云的多项技术自研,底层架构基于自研大规模分布式 存储系统飞天盘古 2.0,存储芯片采用自研 AliflashSSD,并且依托自研网络协议 Luna 和 增强型 RDMA 数据传输协议,结合自研 HPCC 流控算法,深度优化 TCP,大幅降低计算资 源消耗及响应延时,使 ESSD 的数据传输效率可提高 50%。

在这里插入图片描述
方案优势:
∙ ESSD 云盘提供稳定低时延、高吞吐能力,满足核心业务的性能需求。
∙ ESSD 云盘具备 9 个 9 数据高可靠性。
∙ 实现存储资源随业务发展而灵活扩展,支持弹性扩容,运维更简单。

3. 在线教育数据存储解决方案

1)需求背景
在线教育、线上会议都是基于视频直播的企业日常运营典型业务场景,往往依赖于众多的 IT 系统联合构建而成,在客观因素的影响下,在线教育或可迎来一波上云高峰。依托于云计算的技术设施特性,能够帮助企业避免业务侧重复工作、提高资源利用率、降低开发和运维成本。

2)解决方案
阿里云为在线教育机构量身定制了多个场景解决方案,凭借完整的存储产品和服务矩阵、 基于对象存储 OSS 构建的全流程生态、基于数据生命周期的自动管理以及可靠稳定的系统 架构,为在线教育企业在课件文件数据共享存储、课程录制与回看、课程质量智能监控等 场景提供完善的解决方案。
此外,不论是在线教育还是视频会议,都需要很高的网络要求,阿里云 OSS 传输加速,通 过全地域加速网络调度、协议优化,可提升跨省、跨洋数据访问效率,同时支持上传/下载 加速,提升远距离网络访问体验。
在这里插入图片描述
方案优势:
∙ 冷热分离:标准/低频/归档/冷归档/深度冷归档类型,满足从热到冷不同数据的存储需求。
∙ 生命周期管理:自动实现数据从热到冷的类型转换,以及过期删除。
∙ 传输加速:全地域网络链路调度、协议优化,提升远距离上传、下载体验。
∙ 跨区域数据复制:通过跨区域复制构建两个区域间的数据同步,一个区域的数据更新操 作会被自动同步到另一个区域。
∙ 故障切换:当出现区域级重大故障,可以将业务和数据切换到灾备区域,保障服务连续性。

4. 数据湖存储解决方案

1)需求背景
数据湖已经不是一个新概念,在提出的初期也有不少人对数据湖和传统的数仓之间的关系感到困惑。
简单来说,数据湖中一般存储较多的原始数据,包括结构化数据(如关系型数据库中的表), 半结构化数据(如 CSV、JSON 、XML、日志等),非结构化数据(如电子邮件、文档、PDF 等)以及二进制数据(如图形、音频、视频等)。
数据湖在写入时没有模式限制,存储到数据湖的数据在写入过程中,对数据格式没有限制, 可以需要读取数据时,才开始使用各种工具对数据湖中的数据进行分析,相比数仓成本更低,有更高的灵活性。
随着各种数据处理平台和新技术的不断发展,用户对越来越认识到通过挖掘数据价值去支撑业务发展,用户希望能够将数据统一化集中管理,能够使用统一存储平台支撑各类计算平台。

2)解决方案
数据湖非常适合存储大量的结构化、非结构化和半结构化数据。如果场景中正在处理大量 基于事件的数据,比如应用日志或点击流,那么以原始形式存储这些数据并根据基于场景 构建特定的 ETL 并对接数据平台会让数据处理与分析更为便捷。
阿里云对象存储 OSS 作为非结构化数据存储池和数据湖底座,为双十一期间淘宝、天猫、支付宝等应用提供了如丝般顺滑的图片、视频体验。
在这里插入图片描述

方案优势:
∙ 消除数据孤岛:用户的数据可以使用同一个命名空间下统一存储,同一个份数据,可对 接多个数据分析平台,避免孤岛以及数据搬迁。
∙ 不限制数据类型:支持结构化、半结构化、非结构化数据的存储。
∙ 计算生态丰富:支持多种数据导入方式,支持对接开源系统、阿里云多个数据分析平台,和数据消费框架。
∙ 数据冷热分层:多种存储类型组合,用户可根据数据冷热,进行数据分层,优化存储成本。
∙ 计算与存储解耦合:存储空间弹性伸缩,计算的扩缩容与存储解耦,让系统架构更加灵活,成本更节约。
∙ 访问控制:提供更丰富的存储访问控制策略,让数据更安全。

5. 日志采集在微服务架构中的应用

1)需求背景
容器技术在微服务落地过程中的部署、交付等环节给用户带来了越来越多的便捷,同时也会存在容器化应用/非容器化应用混合部署的情况,并且 Kubernetes 作为容器编排领域的领导者,正朝着 PaaS 底座标配方向发展。
阿里云日志服务(SLS)结合阿里云容器服务 Kubernetes 版(ACK)等云产品为以阿里云 公共云产品为基础构建微服务架构的用户提供日志采集、消费和查询分析的能力。

2)解决方案
阿里云日志服务结合 Kubernetes 日志特点以及应用场景,提供了全方位的容器 /Kubernetes 日志的采集解决方案,同时日志服务产品也提供了强大的日志处理分析能力, 如 PB 级日志实时查询、日志聚类分析、Ingress 日志分析报表、日志分析函数、上下游生 态对接等能力,以及在容器/Kubernetes 技术落地应用微服务改造过程中的日志采集运维 一站式管理能力。
在这里插入图片描述
方案优势:
∙ 日志服务与阿里云公共云产品深度集成,提供便捷一站式的日志统一采集、存储、分析和查询的日志运维能力,并提供丰富的报表、告警能力。
∙ 基于阿里云容器服务 Kubernetes 托管版集群与云 NAS 构建互联网微服务应用,高可用及高弹性架构。
∙ 容器镜像服务(ACR)提供自动化部署和更新能力,维护应用的最新状态。数据通过 RDS 存储,提供读写分离容灾能力。
∙ 容器化应用和非容器化应用混合部署,技术架构平滑演进。

6. 高性能计算存储在渲染行业的应用

1)需求背景
伴随着 4K、VR、AI 和仿真技术的高速发展,渲染、游戏等行业越来越依赖高性能计算平 台来替代传统的 IT 分析系统,为业务进入快车道发展争取更多的时间窗口,而背靠在计算 平台之后的存储系统是不可忽视的重要一环。
渲染属于典型的数字内容创作高性能计算应用,渲染的关键之处在于实现集群计算,让海 量节点来分摊成百上千万的渲染小时。随着文娱产业及工业的发展以及显示器硬件的高清 化升级,用户和 CG 制作者对于图形质量如清晰度和画面细节的要求越来越高,行业对于 渲染服务的需求规模和质量要求迅速扩大和提高。

2)解决方案
在渲染前,需要为大规模数据准备足够容量的存储设备;在渲染过程中,还需要高性能来 完成大量的数据处理工作,以生成最终输出。所以,渲染业务对吞吐、IOPS 和元数据 OPS 等要求都非常高,使用传统的存储解决方案将难以满足客户需求。为此可使用基于阿里云 CPFS(并行文件系统)设计的计算存储解决方案。
目前 CPFS 支持公共云上即开即用,也支持通过阿里云定制的 CPFS 一体化软硬件服务用户 的线下数据机房。由于渲染涉及的数据资产需要线下存储,因此本方案实践是通过线下实 施部署的 CPFS 一体机。整体解决方案架构如下:
在这里插入图片描述
方案优势:
∙ 引入协议转换服务,解决多终端和多协议混用。
∙ 通过分布式的协议节点和存储节点,实现节点存储容量和性能实现弹性扩容。
∙ 在计算节点、CPFS 客户端、协议节点和存储节点划分一定容量的内存缓存,加速计算过程的数据读写。
∙ 采用 SSD+HDD 混合部署的模式,解决了冷热数据存储成本问题。
∙ 存储单节点吞吐量达到 2.6GB/s,并随节点数增加线性增长,最大可扩展到近千节点。

7、可观测运维解决方案

1)需求背景
企业上云后,可通过云产品的弹性能力、快速创新力,快速构建企业业务的创新迭代。云产品的使用,在企业业务系统架构中发挥着巨大的作用。随着云上企业使用云产品类型的 不断增加,云产品可观测性对于构建全栈的可观测方案尤为重要。

2)解决方案
Cloud Lens 基于日志服务存储分析底座,支持对接各种日志、监控指标、云产品 Trace 数 据、Trail、关键配置计量数据、关键事件、多账号信息等数据源。您可以创建统一的云产 品访问分析、用量分析、异常监测、性能监控、安全分析、数据保护的场景化洞察大盘, 用于了解组织范围内存储、安全、网络、流量和数据库类云产品的使用情况和活动。

各个 Cloud Lens 应用提供数据接入管理模块和通用功能模块。其中,接入管理模块包括接 入管理、存储目标库管理、自动化采集配置。通过日志服务中的 Cloud Lens 入口或云产品 控制台中的入口,可以使用各个 Cloud Lens 应用。
在这里插入图片描述
方案优势:
∙ 统一云产品运维数据的采集:计量、指标、访问日志、审计日志等数据的跨账号、跨区 域、自动采集。
∙ 提供更全面的云产品可观测能力:用量分析、访问分析、性能分析、异常检测、安全分 析和数据保护。
∙ 提供灵活订阅的数据平台:支持消费组、API、Grafana 等多种数据订阅方式。

四、AI模型训练解决方案

1. 文件存储在飞天 AI 加速中的应用

1)需求背景
高性能并行计算的大规模商业化,使得传统文件系统正面临诸多挑战,如存储资源急剧增 长、成本高、运维管理复杂度大、大规模存储系统的稳定性以及性能无法随规模进行线性 扩展等。阿里云 CPFS(Cloud Paralleled File System)应运而生,CPFS 是一种并行文件 系统。CPFS 的数据存储在集群中的多个数据节点,多个客户端可以同时访问,为大型高性 能计算机集群提供高 IOPS、高吞吐、低时延的数据存储服务。

2)解决方案
在混合云场景中,可以通过自建 Kubernetes 服务,线下集群+云上弹性扩展阿里云 GPU 服务实例+飞天 AI 加速工具加速框架,并采用阿里云 CPFS 存储运行 AI 训练+AI 推理作业 的操作步骤。

飞天 AI 加速工具加速框架分为两个版本,一个用于加速 AI 训练,一个用于加速 AI 推理。 飞天 AI 加速工具训练框架是阿里云推出的统一分布式加速框架,支持主流的训练框架。
在这里插入图片描述

方案优势:
∙ 自主选择:本方案使用了 GPU 云服务器,客户可以根据自己的需求选择相应的 GPU 云服务器实例类型。
∙ 高效的数据访问:并行文件系统 CPFS 作为共享存储,提供高带宽低延迟的数据访问服务。
∙ AI 加速:飞天 AI 加速工具提升训练速度,提升推理性能。

2. 智能媒体管理在人脸语音识别中的应用

1)需求背景
随着 AI 技术在语音识别、人脸识别等方面的广泛应用,AI 技术下的数据管理问题也逐渐凸 显。一般在线课程时长在 30 分钟左右,大多数教师和学生都面对屏幕进行对话,需要基于 视频流的画面进行分析。

以在线教育行业为例,在 1 对 1、K12 教育的场景中,平台方希望能够了解课堂互动、学 生专注度等信息,以便更全面地、自动化地提升在线课程质量,给家长提供课程反馈,并及时对可能的客户流失进行预警。

2)解决方案
阿里云智能媒体管理 IMM 提供人脸检测、人脸搜索、表情识别、语音识别等功能,再结合 存储海量音视频的对象存储 OSS、统一管理访问身份及权限的访问控制 RAM,从而在教学 过程中识别学生表情、分析学生状态,课后给家长提供课程分析报告包括对孩子情绪识别 (如情绪雷达图),专注度评价等,从而进行在线教育教学质量分析等 AI 智能分析。
在这里插入图片描述
方案优势:
∙ 简:开通即用,方便快捷。
∙ 强:依托于阿里云产品强大的媒体智能分析能力。
∙ 灵:在 API 调用方面具有更大的灵活性。

3. 表格存储在推荐系统中的应用

1)需求背景
电商、社交、资讯等互联网应用的良好运营需要一个完善的推荐系统。推荐系统作为业务 精细化运营的主要抓手,颠覆了传统内容输出方式,成为当前海量信息时代流转的核心引擎。而一个高效的推荐系统背后需要海量消息存储与实时、离线分析等功能的支撑。

2)解决方案
阿里云表格存储 Tablestore 是基于共享存储的高性能、低成本、易扩展、全托管的结构化 大数据存储平台,支撑互联网和物联网数据的高效计算与分析,具有极简的数据写入、Serverless 服务、强大的数据检索、完善的计算生态等特特点,同时与对象存储的数据湖 存储对接,优化整体成本。
在这里插入图片描述

方案优势:
∙ 大规模:存储量无上限,提供丰富索引和高吞吐扫描。

∙ 高并发:表格存储 Tablestore 单表写入水平扩展,支持亿行每秒级别。

∙ 实时:数据实时写入,实时可见。

∙ 分层存储:数据实时投递到对象存储构建的数据湖,表格存储 Tablestore 只存储热数据。

4. 文件存储在 AIGC 赛道中的应用

1)需求背景
随着 ChatGPT 现象级出圈,AIGC 关注度爆发性增长。AIGC 即 AI Generated Content, 是指利用人工智能技术来生成内容(如文字、图片、音频、视频,甚至 3D 模型和代码), 被认为是继 UGC、PGC 之后的新型内容生产方式,AI 绘画、AI 写作等都属于 AIGC 的分支。
国外头部企业偏向于通用场景下的 AIGC 能力,国内在 AIGC 应用方向更加场景聚焦。另外创业公司中多以 AI 艺术绘画为应用方向。

2)解决方案
阿里云文件存储 CPFS 支持“数据流动”特性。当文件系统启用该特性后,“数据流动”功能 可以实现将对象存储 OSS 的 bucket 中的数据合并入 CPFS 进行统一命名空间的元数据管 理。用户可以手动或者通过自动 Lazy-load 能力,将 OSS 中的数据复制到 CPFS 中,实现 通过 POSIX 文件接口高速访问 OSS 中的数据,在保持数据在 OSS 中低成本存储的同时, 获得高性能文件访问能力,满足大数据计算场景的需求。

在这里插入图片描述

方案优势:
∙ 训练加速:文件存储 CPFS 并行架构,单集群最高可达 TB/s 级吞吐,为算力长期扩容 提供强劲的数据读写性能。

∙ 资源专享:存储资源独享,实现租户级资源物理隔离,与计算集群合力为客户提供专属 的存算服务,保障数据安全与合规性。

∙ 存储降本:通过存储分层方案,将冷数据存储至对象存储 OSS 中,帮助客户降低数据 存储成本。

∙ 灵活易用:存储租用时长灵活,可按月付费,免运维,提供比线下交付更快的交付周期。

五、混合云存储解决方案

1、基于混合云存储阵列的虚拟化平台搭建

1)需求背景
随着云计算技术的普及,越来越多的企业开始选择了部署云计算方案,公共云的灵活性, 易用性和可靠性也被大家广泛认可。

但也有很多企业对传统存储阵列的依赖度很高,在短期内完全迁移到云端会有诸多的挑战, 可能会涉及到系统的重新构建或者应用程序的开发,对客户来说改动量很大,也会面临不小的风险,同时,还有很多客户对敏感数据的物理存放地有要求。

综上,越来越多的企业开始采用混合云来实现面向未来的数字化转型。

2)解决方案
本方案以混合云存储阵列 SA2600 为基础构建混合云环境,实现 VMware 虚拟化平台的快 速部署以及混合云环境下虚拟机的部署、扩容、云备份等功能。
在这里插入图片描述

方案优势:
∙ 混合云架构:将传统的 VMware 虚拟化平台架构延伸到公有云,有利于和公有云产品 结合,充分利用公有云的规模和弹性优势。

∙ 兼容性强:存储阵列/网关提供 OSS、iSCSI、FCSAN、NAS、FTP 等多种常用存储协议 兼容各类上层业务应用。

∙ 快照云备份:将重要系统的快照备份上云,实现了多数据中心备份,提高了容灾能力。

2、视频监控混合云存储解决方案

1)需求背景
反恐法等政策要求重点目标场所(地铁、机场、工业园区、学校等)监控存储时间扩容, 同时增加监控点位,摄像画质高清。这一系列的要求带来存储容量的剧增,从而进一步产 生如何降低一次性巨额的软硬件采购成本、海量数据高可靠、弹性扩容、基于视频统一汇 聚存储之上的 AI 分析等需求。

2)解决方案
在监控视频上云的场景中,可使用混合云存储阵列形成混合云模式,同时也可以采用直接 上云的方式,也可以纯线下输出与本地专有云打通形成整体解决方案。

在这里插入图片描述
客户视频监控数据可以无缝写入阿里云混合存储产品,该产品即可纯线下输出又可以混合 云输出。混合云场景下,可实现云上云下的数据流转,云上无缝扩容。同时,不管在云上 还是云下的存储数据,都可以无缝与我们 AI 产品如达摩院地雀一体机、数据智能 AI 平台 等无缝对接,进行智能分析。

方案优势:
∙ 宜扩容:混合云方案,节省本地 IDC 机柜空间,降低用电功耗压力,数据无缝上云, 大幅缩短存储项目扩容周期;省成本:无需大规模前期投入,按月付费减少资金压力。
∙ 融合 AI 的存储:打破数据孤岛,统一汇聚之后,结合达摩院、数据智能的能力,为客 户提供相关 AI 分析的能力,有效提升客户运营效率。
∙ 高可靠:云上存储可保证高达 12 个 9 的可靠性。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
天翼认证解决方案架构师题库知识点,帮你直接通过天翼解决方案架构师认证考试。天翼认证解决方案架构师题库知识点,帮你直接通过天翼解决方案架构师认证考试。天翼认证解决方案架构师题库知识点,帮你直接通过天翼解决方案架构师认证考试。天翼认证解决方案架构师题库知识点,帮你直接通过天翼解决方案架构师认证考试。天翼认证解决方案架构师题库知识点,帮你直接通过天翼解决方案架构师认证考试。天翼认证解决方案架构师题库知识点,帮你直接通过天翼解决方案架构师认证考试。天翼认证解决方案架构师题库知识点,帮你直接通过天翼解决方案架构师认证考试。天翼认证解决方案架构师题库知识点,帮你直接通过天翼解决方案架构师认证考试。天翼认证解决方案架构师题库知识点,帮你直接通过天翼解决方案架构师认证考试。天翼认证解决方案架构师题库知识点,帮你直接通过天翼解决方案架构师认证考试。天翼认证解决方案架构师题库知识点,帮你直接通过天翼解决方案架构师认证考试。天翼认证解决方案架构师题库知识点,帮你直接通过天翼解决方案架构师认证考试。天翼认证解决方案架构师题库知识点,帮你直接通过天翼解决方案架
Java后端架构师-2023.xmind是一份关于Java后端架构师在2023年中可能面临的各种挑战和技能要求的思维导图。 首先,作为Java后端架构师,技术能力是最基本的要求之一。需要具备扎实的Java编程技能,熟悉Java的开发框架和工具,如Spring、Hibernate等。同时,掌握主流的数据库系统,如MySQL、Oracle等。对微服务架构和计算平台有一定的了解和实践经验,如Docker、Kubernetes等。 其次,架构设计能力也是核心要求。需要具备良好的架构思维,能够根据业务需求设计合理的系统架构,并保证系统的可伸缩性、高性能、高可用性和安全性。对于分布式系统、消息队列、缓存、负载均衡等技术有深入的理解和应用能力。 此外,团队协作能力也是不可忽视的。作为架构师,需要与产品经理、项目经理、开发团队以及其他相关部门进行良好的沟通和协作,理解和把握业务需求,并能够将架构设计有效地传递给开发团队。善于团队管理和培养能力,能够引导团队成员解决技术难题。 最后,不断学习和适应新技术也是非常重要的。在技术领域,变化日新月异,作为架构师需要保持敏锐的技术判断力,能够及时了解和掌握新的技术趋势,并应用到实际项目中。 综上所述,Java后端架构师-2023.xmind介绍了未来Java后端架构师的技能要求和面临的挑战。通过不断学习和提升,拥有扎实的技术基础和良好的架构设计能力,具备团队合作和沟通能力,以及不断学习和适应新技术,才能在竞争激烈的市场中脱颖而出,成为优秀的Java后端架构师

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值