Ceph分布式存储混合硬件架构方案

最新推荐文章于 2025-04-07 01:15:00 发布

大木叉叉

最新推荐文章于 2025-04-07 01:15:00 发布

阅读量3.3k

点赞数

分类专栏：大数据

本文链接：https://blog.csdn.net/weixin_42385626/article/details/87208900

版权

大数据专栏收录该内容

3 篇文章

订阅专栏

笔者在为容器云做存储支持时开始接触、使用、研究ceph分布式存储系统。Ceph能够同时提供对象存储、文件存储以及块存储，为基于云的海量数据存储提供了较优的解决方案。

具体了解ceph相关内容请参考ceph官网[1]及论文[2]。本文主要讲基于ssd和hdd混合硬件的三种架构方案以及大致步骤，力求在硬件价格成本与存储服务性能之间找到一个最佳平衡点。目前ceph的osd主要可以基于SSD或者HDD的裸盘进行构建，如果全部基于SSD进行构建，毫无疑问其性能一定会最优，但是SSD价格昂贵，出于成本考虑，不可能全部采用SSD进行构建，那么SSD与HDD混合硬件架构就显得很有必要。下面我们根据ceph的功能特点来讲三种架构方案，以及实现的大致步骤。

方案1：主本在SSD其余副本在HDD：

ceph写时先写primary，成功后primary写向其余副本，其余副本写成功才会向ceph客户端响应写成功，而ceph读时直接从primary读取。综合考虑，将primary放在基于SSD的OSD上，其余副本放在基于HDD的OSD上，步骤大体如下：

1.1 设置ceph.conf 主副本倾向性选择性为true
[mon]
…
monosd allow primary affinity = true
…
修改配置后强制同步到集群的其它机器，重启mon。

1.2 将hdd被选为primary的概率设置为0：
ceph osd primary-affinity osd.<id> 0

1.3 编写新的crush rule 使得主副本一定落在ssd上，假设bucket只有host:
     rule ssd-primary-rule{
        ruleset 1
        typereplicated
        min_size 2
        max_size 3
        step take default class ssd
        step chooseleaf firstn 1 type host
        step emit
        step take default class hdd
        step chooseleaf firstn -1 type host
        step emit
       }

1.4 编译crush rule:
1.4.1 获取ceph集群crush map:
ceph osd getcrushmap -o{compiled-crushmap-filename}
1.4.2 反编译获取的map二进制文件:
crushtool -d{compiled-crushmap-filename} -o {decompiled-crushmap-filename}
1.4.3 将1.3中编写的rule添加到反编译可编辑文件的rule集合中；
1.4.4 重新编译生成crush map二进制文件：
crushtool -c {decompiled-crushmap-filename}-o {compiled-crushmap-filename}
1.4.5 将新的crush map注入进ceph集群中:
ceph osdsetcrushmap -i {compiled-crushmap-filename}

1.5 创建pool并指定该pool所用crush rule 为1.3的rule:
ceph osd pool create ssdprimary_pool 128 128
ceph osd poolset ssdprimary_pool crush_rule ssd-primary-rule
至此，对于存储池ssdprimary_pool的主副本一定会落在ssd上，其余副本在hdd上。

方案2：为用户存储池分优先级：