ceph纠删码精简配置ec4+2:1与ec4+2的切换

20 篇文章 0 订阅
9 篇文章 0 订阅

概述

近期遇到项目,由于灵活配置,前期只有部分机器,后续扩容,想用ec4+2的纠删码,但前期只有3台机器,需要做精简ec。

erasure-code-profile

首先按照ceph创建纠删码池步骤进行操作。

创建ec4+2的rule

ceph osd erasure-code-profile set newecrule k=4 m=2

查看该rule

# ceph osd erasure-code-profile get newecrule
crush-device-class=
crush-failure-domain=host
crush-root=default
jerasure-per-chunk-alignment=false
k=4
m=2
plugin=jerasure
technique=reed_sol_van
w=8

创建纠删码存储池

ceph osd pool create testec 1 1 erasure newecrule

通过ceph osd pool ls detail可以看到该pool相关信息,以及分配了crushrule。

如果是正常创建纠删码池,以上步骤基本完成,如果需要做精简ec,或者自定义结构,可以继续操作crushmap。

导出crushmap

导出crushmap,反编译,ceph基操不做赘述,步骤如下:

ceph osd getcrushmap -o crushmap
crushmap -d crushmap -o crushmap.txt

查看crushmap,可以看到刚pool所使用的rule,结构如下

rule testec {
        id x
        type erasure
        min_size 3
        max_size 6
        step set_chooseleaf_tries 5
        step set_choose_tries 100
        step take default
        step chooseleaf indep 0 type host
        step emit

这个就是标准的host容灾的纠删码配置,其中ec的k+m是在erasure code profile中定义,这里的rule就是将纠删码的块分别放到不同host中。
如果前期项目只有3个节点,显然这里pg无法完成peering。

ec4+2:1

如果我们只有3台host,我们可以保留ec4+2的特性,同时通过调整rule,将每两个块放到一个host上,实现ec4+2:1的配置,等到集群扩容完成后,再将rule恢复。

        type erasure
        min_size 3
        max_size 6
       step take default
        step choose indep 3 type host        
        step chooseleaf indep 2 type osd 

此处的rule不难看出,先选3个host,再从host上选择2osd,共6个osd完成pg peering和active。

精简ec的问题

ec4+2host容灾,正常是可以同时离线2个节点而完成自愈,而ec4+2:1只能同时离线一个节点,或者不同节点的2个盘(很好理解,最多损坏两个块)。
此外由于使用choose indep host后choose osd,当某个host下的osd不足完成2个块的数据承担时,仍有可能会被选中,导致pg卡住,无法完成peering。
因此当集群规模,预算足够时,应即使扩容,调整成完整的非精简的ec结构。

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Ceph是一种开源的分布式存储系统,它支持使用删码进行数据保护。在Ceph中,删码被用来替代传统的多副本技术,以降低存储开销。引用提到,删码技术因其低存储开销的特点受到越来越多的关注。Ceph使用的删码方案是RS编码(Reed-Solomon code)。RS编码是一种被广泛使用的删码方案,它将k个数据块按照一定的编码规则生成m个校验块,通过任意的k个编码块都能重建出所有数据。以RS(4, 2)编码为例,它只需要占用1.5倍的存储空间,就可以提供与三副本技术相同的容错能力。因此,Ceph使用删码来实现数据的冗余和容错,以提供高可用性和数据保护。引用中提到,Ceph删码实现是基于C语言接口的范德蒙行列式编码。具体来说,在Ceph中,使用jerasure_encode函数调用jerasure库中的jerasure_matrix_encode函数进行编码处理。jerasure_matrix_encode函数是ErasureCodeJerasureReedSolomonVandermonde类中的一个方法,它实现了删码的编码过程。通过使用删码Ceph可以降低存储开销,并提供数据的高可用性和可靠性。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [删码项目总结](https://blog.csdn.net/tianyi520jx/article/details/126965871)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 50%"] - *2* [Ceph删码编码源码分析](https://blog.csdn.net/wqxl01/article/details/131045453)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值