一、GFS(GlusterFS)概述
1、GFS简介
- 开源的分布式文件系统
- 由存储服务器、客户端、NFS或Samba存储网关组成
- 无元数据服务器(管理的节点服务器被隐藏)
2、GFS的特点 - 扩展性和高性能
- 高可用性
- 全局统一命名空间
- 弹性卷管理
- 基于标准协议(RDMA:(特点去中心化)或TCP/IP)
- 模块化、堆栈式的架构
- 通过对模块的组合,实现复杂的功能
3、GFS术语
- Brick:存储节点、存储块
- Volume:存储卷
- FUSE:用户空间文件系统
- VFS:虚拟的文件系统
- Glusterd:集群
4、GFS用到的算法
弹性HASH算法
- 通过HASH算法得到一个32位的整数
- 划分为N个连续的子空间,每个空间对应一个Brick弹性
HASH算法的优点
- 保证数据平均分布在每一个Brick中
- 解决了对元数据服务器的依赖,进而解决了单点故障以及访问瓶颈
二、GlusterFS的卷类型分
1、布式卷
分布式卷
- 没有对文件进行分块处理
- 通过扩展文件属性保存HASH值
- 支持的底层文件系统有EXT3、EXT4、ZFS、XFS等
分布式卷的特点
- 文件分布在不同的服务器,不具备冗余性
- 更容易、廉价地、扩展卷的大小
- 单点故障会造成数据丢失
- 依赖底层的数据保护
2、条带卷
条带卷
- 根据偏移量将文件分成N块(N个条带节点),轮询的存储在每个Brick Server节点
- 存储大文件时,性能尤为突出
- 不具备冗余性,类似Raid0
条带卷特点
- 数据被分割成更小块分布到块服务器群中的不同条带区
- 分布减少了负载且更小的文件加速了存取的速度
- 没有数据冗余
3、复制卷
复制卷
- 同一文件保存一份或多分副本
- 因为要保存副本,所以磁盘利用率较低
- 若多个节点上的存储空间不一致,将按照木桶效应取最低节点的容量作为该卷的总容量
复制卷特点
- 卷中所有的服务器均保存一个完整的副本
- 卷的副本数量可由客户创建的时候决定
- 至少有两个块服务器或更多服务器
- 具备冗余性
4、分布式条带卷
- 兼顾分布式卷和条带卷的功能
- 主要用于大文件访问处理
- 至少最少需要4台服务器
5、分布式复制卷
- 兼顾分布式卷和复制卷的功能
- 用于需要冗余的情况
三、实例搭建GFS实验
搭建GFS分布式文件系统,掌握创建各种存储卷的方法,创建完成后通过写入和破坏文件测试各种卷的存储方式。
1、实验规划图
2、实验详细配置过程
1)同步所有存储服务器的时间、关闭selinux、关闭防火墙
[root@localhost ~]# ntpdate ntp1.aliyum.com //同步阿里云的时钟服务器
[root@localhost