【CSDN 编者按】这几年,越来越多的企业把业务搬到云上来,阿里云顺势推出一个既兼具物理机的性能同时又能提供虚拟机体验的产品——神龙。这款服务器的架构是怎样的?有何特别之处?在「CSDN 在线峰会 —— 阿里云核心技术竞争力」上,在虚拟化领域拥有十多年经验的阿里云弹性计算团队负责人张献涛深入分享了阿里云智能在新型计算架构方面的探索——神龙计算架构,以及阿里云计算架构演进的相关实践,希望能够对所有技术人有所启发及裨益。
复制链接或点击「阅读原文」可免费观看张献涛老师分享视频:
https://edu.csdn.net/huiyiCourse/detail/1176
作者 | 张献涛,阿里云弹性计算负责人
责编 | 夕颜
出品 | CSDN(ID:CSDNnews)
以下为张献涛演讲实录:
各位朋友们大家好,我是张献涛,花名旭卿。我于2014年加入阿里云智能,当前在阿里云负责弹性计算团队。加入阿里云之前,我在英特尔从事虚拟化相关工作。过去十几年,我基本专注在虚拟化领域。
今天要与各位分享的,是过去三四年间,阿里云智能在新型计算架构方面的一个探索——神龙计算架构,以及阿里云计算架构演进的相关实践。
我今天分享的内容分成四部分:
第一部分是关于神龙架构的背景——阿里云为什么要做神龙,神龙解决了云计算哪些业务痛点。
第二部分介绍神龙架构相关的演进——第一、二、三、四代神龙之间有什么异同点,它们一步一步解决了哪些业务诉求,为用户带来哪些核心价值;
第三点主要介绍的神龙架构的实践——它能给云计算的客户带来哪些价值,比如像刚才叔同老师讲的,神龙结合容器能够提供比在物理机上还要好的性能。
一直以来,从事虚拟化的技术人员都是物理机的性能作为优化目标,研究怎么样能把虚拟化后的能力无限接近物理机,比如做到90%,91%、92%、93%、95%,做到97%、98%可能就做不下去了——它只能无限接近物理机。今天用神龙这种新型计算架构的服务器,再加上阿里云的容器,就可以提供比物理机高百分之几十的性能,收益非常高。
最后我简单介绍一下神龙架构的未来。
神龙架构的背景
在介绍神龙架构的背景之前,这里面有几个数字,来自一个大项目。我相信在线的很多网友都参与过这个好几千亿的项目,每年可能都有机会参与一次,就是天猫双十一。
在2019年的天猫双十一,我们又创造了很多新的历史记录,比如说全天交易额达到了2684亿,相比去年有比较大的提升。第二个数字是54.4万笔每秒,这个代表在0点清空购物车时,每秒钟能够处理交易的笔数。12.92亿个包裹意味着几乎人均一个包裹。
一个个的天量数字背后,都是在阿里云公共云上完成。我们去年达成了一个里程碑事件——整个阿里巴巴经济体业务,全面迁到公共云上面来,100%核心交易系统全面在阿里云上完成。
在三四年之前,没有今天讲的这个神龙架构之前,其实是做不到的。因为双十一上云对公共云平台的挑战非常大,线下也饿徐用物理机去堆是可以的。但是使用公共云的基础设施,要承担阿里巴巴经济体,比如电商、金融、物流相关交易,并且是双十一这种天量的交易,是极大的挑战。
今天我们做到了。背后是神龙服务器在起作用。
我们通过这张图简单直接看一下,左边的照片是2017年10月的云栖大会,我们发布第一代神龙服务器的时刻。在这个时期起,神龙架构开始成为整个阿里云智能最核心的竞争力之一。
为什么它能够承担起像阿里巴巴双十一这样复杂的业务?
第一、因为神龙能够充分地利用云基础设施的力量,也就是这里展示的高弹性。单台服务器,或者一个集群,在线下其实很难利用云基础设施的能力,而神龙云服务器能和云基础设施融合在一起,提供高弹性的资源。比如,你需要更多的存储、更多的网络资源、甚至更多的数据库,你不用停机、你也不用去插硬盘,系统会根据你的管控命令,自动进行资源伸缩。
第二是高稳定,尤其是性能的输出,需要非常稳定。对于笔记本、PC这可能无所谓,但是对于企业级用户所用的服务器来说,性能输出需要是一个稳定的值。
为什么?可能做过业务规划或者容量规划的同学能理解,如果计算性能处于波动的