作者 | 贾凯强、伍杏玲
出品 | CSDN云计算(ID:CSDNcloud)
10 月 20 日,阿里巴巴云栖大会继续在杭州进行,与开幕第一天的主论坛不同,第二天活动的主论坛更加聚焦与技术领域和技术实践。20 日上午,阿里云将服务器、操作系统、人工智能、元宇宙、数据智能等前沿技术悉数亮出,为参会者奉上了一场技术盛宴。
龙蜥降世,神龙升级
会上,阿里巴巴集团副总裁,阿里云智能基础产品事业部负责人蒋江伟宣布,阿里云推出新一代操作系统“龙蜥”并开源。同时,阿里达摩院操作系统实验室也宣告成立。
与之前发布的飞天操作系统不同,龙蜥操作系统定位于服务器端,支持 X86、ARM 等多种芯片架构和计算场景。在阿里巴巴内部打磨 10 年,有效支撑了历年天猫双 11,性能和稳定性都经受住了严苛的考验。同时,龙蜥针对云原生应用开发做了多重优化,为云上典型场景带来 40%的综合性能提升,故障率降低 50%,兼容 CentOS 生态,支持一键迁移,并提供全栈国密能力。
同时,阿里云还宣布推出第四代神龙架构,这是飞天云操作系统新一代虚拟化技术,首次搭载全球唯一的大规模弹性RDMA 加速网络,网络延迟整体降低 80% 以上。神龙4.0 带来的计算架构革新,将云计算首次带进5微秒时延时代。神龙对io的升级还在开发效率的提升,以往的电商客户供应链系统非常复杂,在用户量提升后系统一旦不足以支撑,就需要做分布式架构改造,其过程往往需要 3 到 6 个月,可如果基于神龙架构改造,这一架构不仅能够支持天猫超市目前的体量,甚至未来 2 到 3 年都可以支持,而且升级不需要修改代码。
RDMA 在专用领域是网络延迟和高性能代名词,相比传统TCP 协议,RDMA 能大幅降低网络通信延迟。但是,目前市场上几乎没有企业能够大规模使用 RDMA,这一技术天生有缺陷。但是本代神龙架构攻克了该问题,实现了大规模普惠化的提供RDMA组网能力,阿里云采用软硬一体化的设计思路,将弹性 RMDA 的加速能力融入公共云,让 RDMA 从 HPC 类应用,走向支持通用类计算场景,为 Microservice、Serverless、Service Mesh 等云原生技术大爆发提供技术支撑。
此外,第四代神龙还大幅提升了基础带宽、块存储、IOPS 等核心性能。在深度学习场景下,第四代神龙可提升分布式 NLP 和视觉计算 30% 的训练性能;在大数据场景下,可提升 Spark30% 的计算性能;在数据库场景下,MySQL 性能最高提升 60%、Redis 混合读写吞吐量可提升 130%;NginxSSL 建连每秒吞吐性能提升 420%。神龙 4.0 架构在延时方面表现卓越,其将时延从 90us 提升到了 30us,接近云架构的极限,也接近光速理论极限。
阿里云基础产品负责人蒋江伟表示,作为新一代虚拟化技术的代表,神龙在设计之初就是因云而生的,这次升级一口气在 IO 加速、芯片级安全、云原生弹性和高速网