Topics:
浪潮AS5500G5 8控性能夺冠
讨论长期以来被忽略的一个存储系统性能指标
新指标对业务应用的意义
1
浪潮AS5500G5 8控性能夺冠日前,存储性能委员会(Storage Performance Council,简称SPC)公布了最新的SPC-1基准评测报告,浪潮存储AS5500G5以超330万IOPS(每秒读写操作的次数)、0.387ms时延的评测值,创造了8控存储产品性能的全球最高成绩。这是继16控存储性能领跑 之后,浪潮存储在8控领域再次突破,成为唯一在两大存储主流市场夺冠的厂商。
8控和16控存储是业界的主流产品,主要覆盖15K–100K美元的市场,占整体存储市场份额的60%左右。浪潮存储在这一领域的性能优势,将提升浪潮存储在主流市场的产品竞争力。
本次,浪潮存储以超大比分成功击败华为,夺冠8控性能首位,应该说,这是浪潮存储这些年苦练内功的印证。浪潮存储坚持了近二十年的技术创新和积累,这方面完全没有捷径可走,不仅在硬件设计上下苦功和创新,比如多控之间的信息同步链路,率先采用基于Optane介质的缓存层等等,更关键的是在软件层面的深层优化,比如用户态驱动,QoS,智能感知等等。
浪潮存储在8控存储赛道上具有性能和性价比双重领先优势,在同等控制器配置、同等IT建设成本下,能够支撑更多的数据并发访问,带来业务体验的升级。
SPC-1评测显示,8控存储性能前三名的评测值分别为330万、270万和160万IOPS,浪潮8控存储性能比第二名、第三名分别高出约22%和106%。同时,存储性价比($/KIOPS)也一直是影响企业决策的重要因素,浪潮8控存储每KIOPS价格为$295.73,第二和第三名价格分别为$481.08、$445, 浪潮8控存储价格比第二名、第三名低63%和50%。
在看得见的测评成绩背后,是看不见的技术创新。本次评测中,浪潮AS5500G5相比曾问鼎“中端存储性能第一”的上一代浪潮AS5500G2,在软硬件技术上大幅升级,带来SPC-1性能翻番、延迟减半,实现8控性能全球夺冠。其中在硬件层面,AS5500G5采用全新一代硬件平台,对CPU、芯片、规格和扩展性进行全面升级,此次评测,AS5500G5前端配置4个双控节点,每控搭载英特尔新一代至强CPU、128GB缓存,后端采用全闪配置,部署1.92TB TLC SSD;在软件层面,浪潮AS5500G5基于iTurbo智能引擎技术和全闪I/O栈优化,让存储系统可根据前端应用自动匹配不同数据处理策略,进行智能的IO感知、路径选择、组织和调度,让百万级IO指令和数据块在存储系统内高速传输和流动。在每一个IOPS背后,都是这些技术在支撑。
2
“综合性能指数”大家是否还记得,之前冬瓜哥写过关于队列/延迟/并发的这篇文章。都知道IOPS越高越好,但是却少有人深刻的理解IOPS底层的生成机制。有两个因素对IOPS有加成作用,或者说,存储系统终极目标就是这两个参数:
处理单个I/O耗费的时间(延迟)
有多少个并发线程在处理I/O(并发)
显而易见,并发数/延迟=IOPS。当然,现实中的模型远非如此简单,现实中一般采用异构处理流水线方式处理I/O,也就是流水线中的模块处理的是不同I/O的同一个子步骤,与此相比还有同构流水线,具体见这篇文章。一个理想的提升流水线吞吐量的原则,就是将每一步的处理延迟做到相等且最小,或者将慢速处理步骤并行化。这些理论和思考详见《大话计算机》一书。
但是这并不妨碍我们采用等效变换的方式来审视存储系统性能,可以测试出一个存储系统的等效并发度,详见这篇文章。
根据并发数/延迟=IOPS,并发数越高越好,延迟越低越好。前者是可以很容易的实现的,只需要采用高核心数CPU,以及软件的并行化优化,就可以相对较为轻松的达到目的。但是对于延迟的优化,可就是难上加难了,这就像公路,同时修两个车道把路拓宽,简单,但是想把路修成高速路,其耗费的成本就会很高,对于I/O路径,也是一样,优化I/O处理速度的一些办法包括砍掉那些附加软件功能,重写内核,采用用户态驱动绕过内核,等等,这里面哪一样都不简单。
不妨思考一下,既然这样,存储厂商为了实现高IOPS,是否可以疯狂提升并发数,而对延迟不闻不问呢?这样做IOPS确实可以上来,但是只会在压力测试的时候,通过将队列深度提升以满足这些并发线程的胃口,但是延迟并不会有降低。
在实际场景下,相当一部分应用根本不会以高并发异步I/O模式工作,这类应用发出的都是同步I/O,以至于底层队列根本压不满,存储系统的高并发度根本无用武之地,导致实际性能惨不忍睹,详见这篇文章。
那么,既然IOPS越高越好,延迟越低越好,是否可以用IOPS与Latency的比值来断定一款存储系统的真实能力呢?也不客观,因为厂商可以只优化其中一个参数来实现高比值。
冬瓜哥认为,应该用一种横向比较的比值作为性能指标。比如就拿本次登顶8控SPC1的浪潮,和排第二的华为相对比。IOPS越高越好,延迟越低越好,那就用浪潮IOPS/华为IOPS=I,浪潮延迟/华为延迟=L,然后得出I/L=1.828
1.828这个比值,可以体现出厂商在提升并发度同时优化I/O路径降低延迟方面做的工作的一个均衡价值。也可以这么理解,浪潮8控AS5500G5相比华为8控,在综合I/O性能方面为后者的1.8倍。
如果以某个标准模型性能作为参考,算出每个厂商与这个标准值的比值,就可以得出各个厂商的一个标准指数,我们不妨将这个指数称之为 “综合性能指数”。当然,这个指数只是冬瓜哥凭空一想,如果要有使用价值,可能需要更多的完善理论,比如,既然降低延迟很难而且效果很好,是不是对延迟需要有个更高的权重比例,让那些着手降低延迟方面做出突出技术的厂商得到更高的值。毕竟,延迟这个指标在多数应用中的价值更高。
3
新指标对业务应用的意义延迟对性能的影响几乎深入到各个业务场景。例如国有六大行,每天需要处理超过1亿笔交易,这些都对承载核心业务的存储系统性能提出了巨大的挑战,通常情况下,亿级规模用户对存储性能要求就要数十万级别IOPS,同时时延需要保持在1ms以下,而核心数据库和报表业务对IOPS与时延要求会更高。
再看银行数字化营销,针对于银行智能客服、智能投顾、智能风控、智能营销等智能业务场景,涉及到AI的某些特定模型,对存储系统性能要求极为苛刻,尤其是IOPS和时延性能指标。例如,在训练阶段,以大量随机小IO为主,要求存储具备极强的IO并发处理能力;在推理阶段,要求存储时延低,能快速响应。
未来以交易所、理财机构、保险机构为主的金融机构会面临巨大的IT架构压力,其中对存储系统最大的挑战就是IOPS处理能力和控制时延能力。以股票交易为例,交易途中,存储系统需要高并发接收和处理成百万乃至上千万亿的交易数据时,如果并发能力差、时延高,将导致买卖操作的卡顿,引发股民情绪波动,影响满意度,严重的会导致用户流失。
在金融领域,浪潮存储在某大行帮助客户把在线交易量提升3-5倍,在线交易时间缩短10%-30%,银行桌面系统响应时间缩短60%以上,而在AI自动驾驶领域,将模拟计算反馈时间缩短90%以上。其得益于浪潮存储系统对延迟的优化。
综上,综合性能指数对于现代互联网化的业务场景具有深刻价值。
总结:
随着各行业规模的不断扩大,智慧化转型的不断加速,数据应用于营销、决策和分析已经变得越来越重要,快速响应市场变化的能力已经成为企业的决胜因素,而作为坚实的数字化底座,智算中心数据存储性能将持续得到关注,成为转型“标配”。
扫码入当当/京东直购《大话计算机》
扩展阅读
《大话计算机》序言⑦ by @去流浪
博主简介:冬瓜哥,《大话计算机》与《大话存储 终极版》、《大话存储 后传》图书作者。多项专利发明人。
现任某半导体公司高级资深架构师。
大话计算机 大话存储
长按扫码可关注