华为TechWave峰会上主推的分布式云到底什么来头?

 

上周华为TechWave峰会上,主推了分布式云的产品,这里笔者就给大家来科普一下具体的分布式云的概念。在疫情的影响下,2020年数字经济徒然兴起并持续火爆,各类企业都从数字经济的大潮中找到了跨越式发展的突破点,纷纷躬身入局,以夺取数字经济的高地,很多之前难得在公众场合露面的企业家们,都亲自来到工厂车间乃至田间地头,开启了直播带货的主播生涯,比如水滴公司创始人沈鹏和唱吧创始人陈华都开设了直播间,为自己公司的产品宣传代言,虽然人气不及头部主播,却也获得了社会各界的一致好评。在数字经济这一片繁荣的背后,云的力量起到了关键性的助力作用。业界普遍认为上云可以使企业的硬件投入下降二分之一,运营成本降低三分之二,云计算降本增效的优势逐渐被各行各业所认知。

 

云计算作为新基建的重要组成部分,本身就带有典型的基础设施属性,通过上云可以释放出极强的普惠效应,使各方都能从中受益。在数字时代到来之前普惠产品之所以不温不火,难以真正走入寻常百姓家,究其根本原因还是在于传统行业的信息系统运营成本高,因此从侧面抬高了客户使用成本,云计算降本增效的特性,恰好解决了普惠科技的成本难题,可以说云计算就是普惠科技的基石。

 

而最近开始火爆全球的分布式云,代表了云计算技术发展的最新方向,分布式云将公有云分布到不同的物理位置,但服务的运营、治理和发展依然由公有云提供商负责。具有低延迟、降低数据成本需求和数据驻留要求的企业机构方案提供了一个灵活的环境,同时还使客户的云计算资源能够更靠近发生数据和业务活动的物理位置。预计到2025年,大多数云服务平台至少都能提供一些可以根据需要执行的分布式云服务。 

 

2021年4月8月,华为云TechWave技术峰会将在深圳召开,笔者认为华为云本次提出的“云原生x分布式云”概念将再度引领业界潮流,在此之前像区块链这种分布式账本技术可以做到跨区域协同,但其记账效率不高,而对于效率要求较高的分布式数据库、分布式消息中间件等技术,往往不能跨数据中心部署,这其中最关键的技术难点在于高性能分布式架构,只有运行在极低网络延迟的环境中,跨数据中心、跨地域所带来的网络延迟是很多分布式技术所无法承受之重,因此跨域整合的分布式云,在当时还只能停留在理论层面,不过随着5g技术的成熟,云网融合的推进,网络延迟的封印已经被解除,由此分布式云终于可以落地来到人们身边。而回顾我国IT架构的演进历史也能够帮助我们更好的理解分布式云的前世今生。

 

缘起-闻所未闻的高并发

 

2009年中国IT业发生了两件大事,一个“双十一”购物节正式开始,另外一个《开心农场》这款全民级游戏进入了网友们的生活,从此以后“剁手”和“偷菜”就成了中国互联网史上最疯狂的两大增长奇迹,2009年首次“双十一”的营业额是5200万,到了10年后的2019年这个数字翻了5000多倍,跃变到了2684亿,而《开心农场》在上线后更是战绩非凡,三个月内每天都有高达100万的用户增长,据说最后投放给《QQ农场》的服务器超过了4000台。

 

这种爆炸式增长是当时中国IT产业高速发展的一个缩影,当时很多中国的科技企业都创造了类似的增长神话,不过这样的野蛮生长也成为了中国IT人的甜蜜负担,中国的程序员们渐渐发现其用户的增长速度已经渐渐超出系统处理能力的提升速度了,而原有中心化系统体系与这种高并发的场景格格不入,使用传统数据库及中间件的产品方案有如南辕北辙,无法真正解决问题。

 

正是在这样的环境下,我国IT业开启了分布式技术的探索之路,以前提升算力的思路是让服务器越来越强,而云计算虚拟化的分布式思路是只需要增加服务器节点的数量,就能处理更多的并发服务请求。分布式系统的业务连续性,是靠整个服务体系的容错能力造就的。欲戴皇冠,必承其重,中国的科技企业不可能只享受用户增长带来的好处,却不为此付出努力,像存储、数据库等等重要的基础软硬件到底如何进行低成本的分布式改造,就需要中国的程序员们自己给出的答案了。

 

爆发-存储、数据库基础软硬件全要分布式

 

从笔者所在的银行业举例,想要对于金融系统进行分布式改造要有两项关键的技术支撑,一是要靠数据库的支持,在保证性能的同时不能出现错漏帐;二是要依靠存储技术对于数据库及其它消息中间件进行性能保障。

以笔者的经验来看,存储改造的挑战最大,因为在当下的数字化时代,银行都需要将客户的开户、转账乃至与客服沟通时涉及影像、音频资料全部记录下来,而这些都是百K左右的小文件,相比传统的大文件来说,想要高效的存储这种细碎的小文件,一是要解决索引和数据尺寸协调的空间问题,二是要解决大规模下的成本问题,比如我们使用的华为Oceanstor 18xxx系列产品,就对于这种小文件的存储需求进行了大幅的优化,直接采用读写裸设备(RawDisk)跳过传统文件系统,任意小文件都保证一次磁盘IO就能返回,最大化了存储服务器磁盘的IO能力,同时由于访问路径最短,IO次数确定,其读取延时也是最佳的,在小文件优化方面,华为存储比之前存储行业的巨头EMC做得更好,而且Oceanstor 18xxx系列产品完全吸取了分布式架构的优点,可以动态扩容、缩容,帮助我们轻松的进行容量伸缩及管理。

当然数据库方面也同样是个不小的挑战,现在数据库方面有两大流派,一个是非关系型(NoSQL)数据库,这是一种专门用来存储海量数据的Key-Value型数据库,一般来说在用于用户画像等数据挖掘方面的工作;另外一个是关系型(SQL)数据库,SQL数据库在关联计算方面很强,一般用于联机交易场景。原本Sql与NoSQL的应用场景两不重叠,井水不犯河水的,但随着移动互联网时代的到来,海量数据的关联计算这种融合NoSQL与SQL的需求也开始逐渐增多。

 

为解决NoSQL与SQL相结合的问题,Garnter在2014年提出了混合负载的HTAP(Hybrid Transactional/Analytical Processing)概念,HTAP是在保留原有在线交易功能的同时,强调了数据库原生计算分析的能力。支持混合负载的数据库能够避免在传统架构中,在线与离线数据库之间大量的数据交互,同时也能够针对最新的业务数据进行实时统计分析。而华为的GaussDB就是这样一款整合了TP与AP特性的混合式HTAP数据库,完美结合了SQL与NoSQL两种范式。GaussDB这种HTAP数据库能够满足直播带货这样传统数据库产品难以覆盖的场景,因为在直播中的交易既要更新商家的库存买家的帐户余额,又要对进行用户画像时,从客户行为情况入手进行精确营销,可谓打通NoSql与Sql任督二脉

大成-5g驾到,召唤神龙

 

分布式技术的最大优势就是屏蔽底层的实现细节,从而将基础软硬件完全服务化,比如在完成了分布式改造之后,客户看到的就是一个整齐划一的存储或数据库,而不需要指明数据具体要存储在哪个节点上。而很多企业在进行应用部署时也希望达到类似的效果。

在分布式云产品落地前,客户要部署应用时必须要指明服务所在的Region,如果把服务全都部署北京,那么兰州的用户可能会卡,而如果分配一部分资源部署在兰州,考虑到西部地区的访问量较小,又会造成资源的浪费,如何合理调配各区域数据中心之间的资源一直是云用户的最大痛点。

分布式云就是解决这一痛点的钥匙,其最大优点就是跨数据中心的服务一致性,企业在部署服务时完全不需要考虑这个服务是部署在哪个中心上的,访问请求多的中心就多分配资源,访问请求少的中心就少分配资源,而这一切都是由分布式云自动调度的。同时分布式云带有天然的灾备属性,在某一中心发生中断事件后可以平滑切换到其它中心提供服务。

分布式云可以在保证用户体验最佳的基础上,合理分配资源,从而进一步降低企业运营成本,不过这需要在虚拟化层、存储层及数据库等基础软、硬件分布式改造的基础上,解决跨数据中心的网络延时问题,而5g技术成熟后,其超低延时的特性甚至可以用于远程手术以及精确控制的工业物联网等领域,完全可以满足分布式云对于跨中心网络延时的需求,可以说5g的引入也彻底标志着分布式云这条神龙将被召唤出来。

云计算技术以其特有的共享、共赢的服务理念都与普惠科技时代需求高度重合,所以这也是我国各产业一次涅槃重生的契机,虽然数字化转型对技术要求更高,时间也更为紧迫,但只要把握住这次机会,我国将成为时代潮流的领跑者,为今后更进一步的服务体系升级打下紧实基础。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值