一天晚上,小灰做了一个离奇的梦,在梦里,他得到了七颗龙珠。这七颗龙珠可以召唤出强大的神龙,帮助自己实现一个愿望......
神龙说完话,化作七道金光飞向远方,睡梦中的小灰也惊醒过来。
————— 第二天 —————
什么是神龙架构?
神龙架构(X-Dragon)是阿里云自研的软硬件一体化计算架构,包含神龙虚拟化芯片,神龙Hypervisor系统软件,神龙服务器硬件架构,深度融合了物理机和虚拟机特性,可兼顾虚拟机的弹性资源、分钟级交付、全自动运维和物理机的性能优势、完整特性和硬件级隔离,为用户了提供一种新型的计算资源交付方式。
相比传统服务器,神龙可为企业提供高性能、高稳定性、高安全性弹性计算服务。
据测试,基于阿里云神龙架构的ECS性能稳定性比一般服务器提升10倍以上,延迟降低65%。在容器场景下,阿里云神龙服务器比客户线下IDC物理机性平均可提升30%以上。
2019年杭州云栖大会上,神龙架构升级到第三代,拥有更高快的性能和更轻的虚拟化,性能损耗接近零,从而百分百释放计算能力!
神龙架构这么厉害,都有哪些应用场景呢?
功夫电影里常说:“天下武功,唯快不破。”在计算世界,这也是不破的真理。神龙架构“快”的特点,让它可以承担从轻量级计算到高性能计算所有的云计算任务,例如可以支持ECS,还可以通过灵活的配置,组成计算力强大的超级计算集群,为HPC高性能计算提供驱动力。
以人工智能为例,训练一个模型可能需要数天甚至数周时间。传统的计算面对这类场景也束手无策,通过异构计算集群来加速训练是最常用的途径。而神龙则把异构超算能力带到了云上,可以轻松满足这种大算力场景的需求。基于神龙架构的异构超算集群SCCGN6,结合低延时RDMA网络、高性能并行文件系统CPFS以及分布式加速框架Ali-Perseus(擎天),最高可以实现100%的性能提升,从而最大限度发挥芯片的计算性能。
以ImageNet竞赛的128万张图片的数据集为例,用普通计算资源训练ResNet50模型,如要达到75%的精度需要数天甚至一周的时间,而使用神龙异构超算集群,模型训练可以缩短到几分钟。
不仅如此,神龙还非常适合目前最流行的容器技术。目前来看,神龙裸金属服务器运行容器对比物理机有10%-30%的性能优势。在阿里巴巴内部,神龙已大规模应用于阿里巴巴集团淘宝、天猫、菜鸟等业务,解决了高峰值流量下的性能瓶颈,在双11、618等大促业务场景中发挥巨大作用。在未来,阿里经济体都将运行在神龙架构上。
无独有偶,在神龙架构推出不久,AWS(亚马逊云)也推出了他们的Nitro架构,这两款架构在当时的性能不分伯仲,但神龙迭代更快,已经领先了一大截了。
毫无疑问,云计算改变了人们获取算力的方式,是计算机史上发展的一大步,但这并非终点,云的未来依旧拥有极大的想象空间,新一轮创新已经开始。