Ceph Erasure Coding Cognize
1、概述
RedHat公司日前发行了旗下Inktank Ceph企业版软件的1.2版本,增加了纠删码、缓存分层的特色,并且更新了管理和监控分布式对象存储集群的工具。
这次发布是RedHat自5月份现金收购Inktank Storage公司后的首次产品更新。聚焦云、备份和归档,Inktank Ceph 企业版(ICE)结合开源Ceph软件,以支持对象和块存储、Calamari监控和管理工具,还有产品支持服务。
RedHat的ICE 1.2软件定义存储带来的是与最新开源Ceph存储软件Firefly相符的商业支持产品,并且两个关键的新特点——纠删码和分层部署——已经产生了收益。
据在欧洲核子研究中心IT部门Ceph服务经理和存储工程师Dan van der Ster说,Inktank客户欧洲核子研究中心(CERN),一家总部设在日内瓦的欧洲核研究组织,将纠删码视为一种重要的功能。
“这是唯一的方法,可以构建一个持久且负担得起的多字节规模的集群,” van der Ster通过电子邮件说。“但是,所涉及的复杂的数据造成一个非常重大的性能损失。所以,我们很高兴能测试新pool-tiering Ceph的功能——目前在Firefly发行版上可用的功能——看看相结合的解决方案(纠删码加分层)对我们的块和物理数据用户是否可行。”
Red Hat推荐那些想要纠删码和高速性能的客户考虑新增的cache-tiering特色,它可以保持最热的数据在高性能媒体,而冷数据性在低性能媒体, Ceph营销和社区的公司董事Ross Turk说。
“这允许你在Ceph中开辟一个池并且可以把它变成另外一个池的读缓存或是回写缓存,”Turk说。“如果你有一个非常密集的消除编码的支持池,不见得特别快,但十分划算,你就把SSD(固态硬盘) 的缓存池放在它前面,这将确保你快速访问到最热的数据。”
Ceph的默认纠删码库是Jerasure,当管理员创建一个erasure-coded后端时,可以指定数据块和代码块参数。ICE的纠删码默认设置是2 + 1,这意味着系统把数据分为两部分,创建一个额外的块并将它们存储在三个对象存储设备。
然而,Turk表示,该公司不希望大多数人在生产中使用默认设置。他说12 + 2 erasure-coded池可能会成为一个更常见的选择,提供良好的数据分布,容忍两个节点的故障,担负低存储开销。
Turk指出纠删码的潜在经济效益,因为ICE的定价是基于能力。他说客户可以以同样的初始容量存储更多的数据,权衡起来,相对复制副本,系统需要更多的时间和处理能力做恢复数据的计算。
“当你设计一个存储集群,您必须始终提供过剩的容量。如果我想把100 GB的数据投入存储集群,一般通过Ceph,我需要购买价值