首先,聊聊关于ceph的作用:
传统的存储方法主要是物理硬盘存储、nfs文件系统挂载存储,物理硬盘组成的存储柜相对费用较昂贵,nfs文件系统挂载存储方式读写速度较慢。
货比货,能更清晰的看出来一个技术存在的价值,分布式存储相比物理硬盘存储柜大幅降低了成本,相比nfs文件系统,提高了读写速度。另外,ceph作为分布式存储的一种方式,提供了四个访问存储的方式,也是传统物理硬盘存储柜和nfs文件系统挂载存储所不具备的。
分别是:
block 块存储(类似于物理硬盘存储)
filesystem 文件系统存储(相当于升级版的nfs)
rados gateway 分布式存储网关
librados (方便开发人员通过编程语言直接访问存储系统)
那么关于存储能力的比较,ai给出的答案是,同样的物理磁盘,做成ceph存储集群之后,能存储的数据量是普通方式的6.5倍。这个效果可能更直观。
那么究竟什么是ceph,先看一张图。
这个图,是我自己做的,要明白什么是ceph,首先要知道什么是rados,rados是个分布式存储系统,英文是 :
reliable autonomic distributed object storage
可靠的、自适应的、分布式的 对象存储
而ceph,是建立在rados基础上的一个系统,在rados的基础上增加了四种访问方式,如图:
也就是开头所说的四种方式,block\filesystem\rgw gateway\librados
ceph的核心理念是什么?
软件定义存储,也就是通过各种程序的算法,来完成一个高容量、高可靠、且成本低的存储系统。把原先比如100个100G的存储硬盘,做成一个容量大约是6.5wG的存储系统,而且这个系统可以提供四种访问方式,而且这个系统里面每一份数据会有两个备份,总共存三份,而且这个系统里面通过程序的设计,可以自检验,有物理存储磁盘出现故障的情况,系统会自动把存在这个地方的数据重新在其他磁盘生成。
这,也就是ceph的厉害之处。
理解了ceph和rados的关系(可以简单理解为ceph包含rados),那么接下来就要看看rados这个分布式存储系统里面的组件都有哪些?分别是什么作用?
这里,还是要提醒一下读者,ceph和rados都是软件,也就是虚的,真实的物理磁盘就是普通的物理磁盘。
五个组件:
mon monitor 中文是班长的意思,在这里是监视器,就是监控每个存储节点的状态
mgr manager 可以提供基于web的ceph仪表盘,方便可视化管理和操作集群
osd object storage daemon 每一个具体的物理存储节点,都有一个osd守护程序
mds metadata server 提供filesystem文件系统访问存储集群的方式
rgw rados gateway 提供通过restful api与存储集群交互的能力
本篇先简单的分享一下对ceph概念的理解,下次再分享ceph集群更多的专业名词的含义,以及ceph集群的配置方法