【冬瓜哥手绘】它保你上线性能也吊炸天！

最新推荐文章于 2021-02-12 10:18:18 发布

大话存储

最新推荐文章于 2021-02-12 10:18:18 发布

阅读量633

点赞数

本文链接：https://blog.csdn.net/TV8MbnO2Y2RfU/article/details/78103724

版权

在之前的文章《为何测试时性能吊炸上线却掉渣？》一文中冬瓜哥向大家介绍了这个问题的本质原因，就是IO路径的时延太高而导致同步IO场景吞吐量上不来。

对于固态存储系统，固态盘本身的时延非常低，而此时虽然利用传统的高时延协议栈也能获得远高于机械盘的性能，但是离着固态盘的极限性能就差了一大截了。什么原因？还是时延高导致的，走路的时间比干活的时间还长，产量当然就上不来了。

文章发出后，反响强烈。华云网际（FusionStack）的CTO王劲凯老兄发消息说他们的FusionStor分布式存储系统能保你上线性能也吊炸天。基于SSD盘，他随手一跑就跑出5.3GB/s的随机4K读吞吐量。冬瓜哥换算了一下，这可是138万的IOPS。

7:3比例的读写测试数据也相当牛。

他说这对FusionStor是小菜一碟，目前FusionStor的单节点极限性能可以达到200万IOPS，目前正在通过从CPU、缓存等体系结构底层的优化从而向1000万IOPS迈进，注意，是单节点，而不是整个集群系统。

冬瓜哥：单线程，QD=1时呢？模拟同步IO场景啊。老王又给出了下列数据：

单线程下达到这个性能已经非常不错了，读时延在106微秒，算上SSD执行IO时候的时延，整个FusionStor协议栈对IO时延控制的很好。

FusionStor把单个IO软件堆栈处理时间压缩到5个微秒（不含SSD的读写时间）。单个CPU core 在10万IOPS情况下，平均延迟能控制在400微秒。在10个CPU core的服务器上，FusionStor可以提供100万IOPS的处理能力。预计到2017年底，FusionStor的单个IO软件堆栈时延将要压缩到2个微秒，在10 CPU core的服务器上将能提供一千万IOPS的处理能力。

怎么做到的

FusionStor定位为Flash优先的软件定义存储。其设计的原则保持Flash裸金属性能的前提下，实现高可用和可管理性。为了保证Flash的裸金属性能，FusionStor绕过操作系统，采用低延迟的方案重新实现和存储相关的软件堆栈。传统的模型有几个缺陷：