GFS分布式文件系统

目录

一,ClusterFS概述

FS:文件系统组成

二,分布式文件系统

GLusetrFS特点

GlusterFS术语

三,GFS工作原理

四,GFS支持的其中卷

五,实际操作

2、更改节点名称

3、节点进行磁盘挂载,安装本地源

4、添加节点创建集群

5、根据规划创建卷

1.创建分布式卷

3.创建复制卷

4.创建分布式条带卷

5.创建分布式复制卷

6、部署gluster客户端

7、查看文件分布

1、查看分布式文件分布(node1:/dev/sdb1、node2:/dev/sdb1)

2、查看条带卷文件分布(node1:/dev/sdc1、node2:/dev/sdc1)

3、查看复制卷文件分布(node3:/dev/sdb1、node4:/dev/sdb1)

4、查看分布式条带卷分布(node1:/dev/sdd1、node2:/dev/sdd1、node3:/dev/sdd1、node4:/dev/sdd1)

5、查看分布式复制卷分布(node1:/dev/sde1、node2:/dev/sde1、node3:/dev/sde1、node4:/dev/sde1)

六、冗余测试


一,ClusterFS概述

ClusterFS:分布式文件系统

FS:文件系统组成

文件系统组成:

1,文件系统接口

2,对对象管理的软件集合

3,对象及属性

ClusterFS文件系统作用

文件系统作用:从系统角度来看,文件系统是对文件存储设备的空间进行组织和分配,负责文件存储并对存入的文件进行保护和索引的系统。

具体来说:它负责为用户建立文件,存入,读出,修改,存储文件,控制文件的存储。

文件系统的挂载使用:

除根文件系统以外的文件系统文件后要使用需要线挂载至挂载点才可以被访问,挂载点即分区设备文件关联的某个目录文件比如:NFS

二,分布式文件系统

GFS是由三部分组成(组件)

1存储服务器

2客户端

3NFS/Samba存储网关组成

比如说cd这个命令,执行过程中默认调用内核中函数,切换路径的功能,相当于系统调用。

GLusetrFS特点

扩展性和高性能

高可用性

全局统一命名空间

弹性卷管理

基于标准协议

GlusterFS术语

Brick:快服务器,使用固态盘存储数据类型

Volume:卷组,组合形式的存储

FUSE:伪文件系统(虚拟出来的文件系统)

VFS:伪文件系统(虚拟出来的文件系统)

PS:虚拟化:软件的技术来去模拟硬件的功能

Glusterd:GFS的一个server端(守护进程)

模块化的堆栈式的架构

模块化,堆栈式的架构(比如1-10有很多种组合方式最终展示的形式也是不一样的)

通过对模块的组合,实现复杂的功能。

三,GFS工作原理

解释的是如何通过存储在客户端上的数据,最终存储在GFS后端的卷里。

客户端通过挂载的方式访问文件系统,通过所谓的系统调用方式,和内核中的文件系统进行交互,正常存储数据的时候,正常和exit4对接就行,可以存储在本地。交给另一个文件系统接管,为了不给系统造成太大的压力,(只要提供一个可被调用的接口,所以交给VFS伪文件系统)通过FUSE伪文件系统转存(保存在一个虚拟的路径,映射的位置是/dev/fuse,这个数据和GFS的client端进行交互),伪文件系统的这个数据是存在内存中的,client端会监听数据,当更新时候,交给server端,这个时候要经过一个网络的转发(可以使用TCP/IP或者使用IB),网关是NFS。传到server端后,转存到本地的vfs伪文件系统中,再转存到本地。

四,GFS支持的其中卷

1分布式卷(默认):文件通过哈希算法分不到所有Brick Server 上,这种卷是GFS的基础。

2、条带卷(默认):类似RAID0,文件被分成数据块并以轮询的方式分布到多个Brick Server上,这种卷是Glusterf的基础,以文件为单位根据算法散列到不同的Brick,其实,只是扩大了磁盘的空间,如果有一块磁盘损坏,数据将被丢失,数据文件及的RAID0

3、复制卷(Replica volume):将文件同步到多个Brick上,使其具备多个文件副本,属于文件级RAID 1,具有容错能力。

4、分布式条带卷(Distribute Stripe volume):Brick Server数量是条带数(数据块分布的Brick数量)的倍数,兼具分布式卷和条带的特点。

5、分布式复制卷(Distribute Replica volume):Brick Server数量是镜像数(数据副本数量)的倍数,兼具分布式卷和复制卷的特点。

6、条带复制卷(Stripe Replca volume):类似RAID10,同时具有条带卷和复制卷的特点。

7、分布式条带复制卷(Distribute Stripe Replicavolume):三种基本卷的复合卷通常用于类Map Reduce应用

五,实际操作

Node1节点:node1/192.168.189.101	  磁盘: /dev/sdb1			挂载点: /data/sdb1
											/dev/sdc1					/data/sdc1
											/dev/sdd1					/data/sdd1
											/dev/sde1					/data/sde1

Node2节点:node2/192.168.189.102	  磁盘: /dev/sdb1			挂载点: /data/sdb1
											/dev/sdc1					/data/sdc1
											/dev/sdd1					/data/sdd1
											/dev/sde1					/data/sde1

Node3节点:node3/192.168.189.103		  磁盘: /dev/sdb1			挂载点: /data/sdb1
											/dev/sdc1					/data/sdc1
											/dev/sdd1					/data/sdd1
											/dev/sde1					/data/sde1

Node4节点:node4/192.168.189.120   	  磁盘: /dev/sdb1			挂载点: /data/sdb1
											/dev/sdc1					/data/sdc1
											/dev/sdd1					/data/sdd1
											/dev/sde1					/data/sde1

=====客户端节点:192.168.189.100=====

1、首先,每台节点添加四块磁盘,仅做实验,无需太大
2、然后,重启服务器,准备开始部署

2、更改节点名称

node1(192.168.18.101)

[root@localhost ~]# hostname node1
[root@localhost ~]# su -
上一次登录:四 12月 30 10:20:12 CST 2021从 192.168.189.1pts/0 上
[root@node1 ~]# su -

node2(192.168.18.102)

[root@localhost ~]# hostname indo2
[root@localhost ~]# su
[root@indo2 ~]#

node(192.168.184.103)

[root@node4 ~]# hostname node3
[root@node4 ~]# su
[root@node3 ~]# 

node(192.168.184.104)

​[root@node4 ~]# hostname node5
[root@node4 ~]# su
[root@node5 ~]# 

3、节点进行磁盘挂载,安装本地源

所有节点(这里使用node1作为示范)

[root@node1 ~] # systemctl stop firewalld
[root@node1 ~] # setenforce 0

[root@node1 ~] # vim /opt/fdisk.sh

#!/bin/bash
NEWDEV=`ls /dev/sd* | grep -o 'sd[b-z]' | uniq`
for VAR in $NEWDEV
do
   echo -e "n\np\n\n\n\nw\n" | fdisk /dev/$VAR &> /dev/null
   mkfs.xfs /dev/${VAR}"1" &> /dev/null
   mkdir -p /data/${VAR}"1" &> /dev/null
   echo "/dev/${VAR}"1" /data/${VAR}"1" xfs defaults 0 0" >> /etc/fstab
done
mount -a &> /dev/null

========》wq

[root@node1 ~] # chmod +x /opt/fdisk.sh
[root@node1 ~] # cd /opt/
[root@node1 /opt] # ./fdisk.sh

[root@node1 /opt] # echo "192.168.184.10 node1" >> /etc/hosts
[root@node1 /opt] # echo "192.168.184.20 node2" >> /etc/hosts
[root@node1 /opt] # echo "192.168.184.30 node3" >> /etc/hosts
[root@node1 /opt] # echo "192.168.184.40 node4" >> /etc/hosts

[root@node1 /opt] # ls
fdisk.sh  rh
[root@node1 /opt] # rz -E
rz waiting to receive.
[root@node1 /opt] # ls
fdisk.sh  gfsrepo.zip  rh
[root@node1 /opt] # unzip gfsrepo.zip 

[root@node1 /opt] # cd /etc/yum.repos.d/
[root@node1 /etc/yum.repos.d] # ls
local.repo  repos.bak
[root@node1 /etc/yum.repos.d] # mv * repos.bak/
mv: 无法将目录"repos.bak" 移动至自身的子目录"repos.bak/repos.bak" 下
[root@node1 /etc/yum.repos.d] # ls
repos.bak
[root@node1 /etc/yum.repos.d] # vim glfs.repo

[glfs]
name=glfs
baseurl=file:///opt/gfsrepo
gpgcheck=0
enabled=1

========》wq

[root@node1 /etc/yum.repos.d] # yum clean all && yum makecache
已加载插件:fastestmirror, langpacks
正在清理软件源: glfs
Cleaning up everything
Maybe you want: rm -rf /var/cache/yum, to also free up space taken by orphaned data from disabled or removed repos
已加载插件:fastestmirror, langpacks
glfs                                                                  | 2.9 kB  00:00:00     
(1/3): glfs/filelists_db                                              |  62 kB  00:00:00     
(2/3): glfs/other_db                                                  |  46 kB  00:00:00     
(3/3): glfs/primary_db                                                |  92 kB  00:00:00     
Determining fastest mirrors
元数据缓存已建立

[root@node1 /etc/yum.repos.d] # yum -y install glusterfs glusterfs-server glusterfs-fuse glusterfs-rdma

[root@node1 /etc/yum.repos.d] # systemctl start glusterd.service 
[root@node1 /etc/yum.repos.d] # systemctl enable glusterd.service
Created symlink from /etc/systemd/system/multi-user.target.wants/glusterd.service to /usr/lib/systemd/system/glusterd.service.

[root@node1 /etc/yum.repos.d] # systemctl status glusterd.service
● glusterd.service - GlusterFS, a clustered file-system server
   Loaded: loaded (/usr/lib/systemd/system/glusterd.service; enabled; vendor preset: disabled)
   Active: active (running) since 二 2021-03-02 19:45:10 CST; 764ms ago
 Main PID: 51664 (glusterd)
   CGroup: /system.slice/glusterd.service
           └─51664 /usr/sbin/glusterd -p /var/run/glusterd.pid --log-level INFO

12月 30 19:45:10 node1 systemd[1]: Starting GlusterFS, a clustered file-system server...
12月 30 19:45:10 node1 systemd[1]: Started GlusterFS, a clustered file-system server.

4、添加节点创建集群

添加节点到存储信任池中(仅需在一个节点上操作,我这里依旧在node1节点上操作)

[root@node1 ~] # gluster peer probe node1
peer probe: success. Probe on localhost not needed
[root@node1 ~] # gluster peer probe node2
peer probe: success. 
[root@node1 ~] # gluster peer probe node3
peer probe: success. 
[root@node1 ~] # gluster peer probe node4
peer probe: success. 

[root@node1 ~] # gluster peer status
Number of Peers: 3

Hostname: node2
Uuid: 2ee63a35-6e83-4a35-8f54-c9c0137bc345
State: Peer in Cluster (Connected)

Hostname: node3
Uuid: e63256a9-6700-466f-9279-3e3efa3617ec
State: Peer in Cluster (Connected)

Hostname: node4
Uuid: 9931effa-92a6-40c7-ad54-7361549dd96d
State: Peer in Cluster (Connected)

5、根据规划创建卷

========根据以下规划创建卷=========
卷名称 				卷类型				Brick
dis-volume			分布式卷			node1(/data/sdb1)、node2(/data/sdb1)
stripe-volume		条带卷			node1(/data/sdc1)、node2(/data/sdc1)
rep-volume			复制卷			node3(/data/sdb1)、node4(/data/sdb1)
dis-stripe			分布式条带卷		node1(/data/sdd1)、node2(/data/sdd1)、node3(/data/sdd1)、node4(/data/sdd1)
dis-rep				分布式复制卷		node1(/data/sde1)、node2(/data/sde1)、node3(/data/sde1)、node4(/data/sde1)

1.创建分布式卷

#创建分布式卷,没有指定类型,默认创建的是分布式卷

[root@node1 ~] # gluster volume create dis-volume node1:/data/sdb1 node2:/data/sdb1 force
volume create: dis-volume: success: please start the volume to access data

[root@node1 ~] # gluster volume list
dis-volume

[root@node1 ~] # gluster volume start dis-volume
volume start: dis-volume: success

[root@node1 ~] # gluster volume info dis-volume
 
Volume Name: dis-volume
Type: Distribute
Volume ID: 8f948537-5ac9-4091-97eb-0bdcf142f4aa
Status: Started
Snapshot Count: 0
Number of Bricks: 2
Transport-type: tcp
Bricks:
Brick1: node1:/data/sdb1
Brick2: node2:/data/sdb1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on

3.创建复制卷

#指定类型为 replica,数值为 2,且后面跟了 2 个 Brick Server,所以创建的是复制卷

[root@node1 ~] # gluster volume create rep-volume replica 2 node3:/data/sdb1 node4:/data/sdb1 force
volume create: rep-volume: success: please start the volume to access data

[root@node1 ~] # gluster volume start rep-volume
volume start: rep-volume: success

[root@node1 ~] # gluster volume info rep-volume
 
Volume Name: rep-volume
Type: Replicate
Volume ID: 9d39a2a6-b71a-44a5-8ea5-5259d8aef518
Status: Started
Snapshot Count: 0
Number of Bricks: 1 x 2 = 2
Transport-type: tcp
Bricks:
Brick1: node3:/data/sdb1
Brick2: node4:/data/sdb1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on

4.创建分布式条带卷

#指定类型为 stripe,数值为 2,而且后面跟了 4 个 Brick Server,是 2 的两倍,所以创建的是分布式条带卷

[root@node1 ~] # gluster volume create dis-stripe stripe 2 node1:/data/sdd1 node2:/data/sdd1 node3:/data/sdd1 node4:/data/sdd1 force
volume create: dis-stripe: success: please start the volume to access data

[root@node1 ~] # gluster volume start dis-stripe
volume start: dis-stripe: success

[root@node1 ~] # gluster volume info dis-stripe
 
Volume Name: dis-stripe
Type: Distributed-Stripe
Volume ID: beb7aa78-78d1-435f-8d29-c163878c73f0
Status: Started
Snapshot Count: 0
Number of Bricks: 2 x 2 = 4
Transport-type: tcp
Bricks:
Brick1: node1:/data/sdd1
Brick2: node2:/data/sdd1
Brick3: node3:/data/sdd1
Brick4: node4:/data/sdd1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on

5.创建分布式复制卷

指定类型为 replica,数值为 2,而且后面跟了 4 个 Brick Server,是 2 的两倍,所以创建的是分布式复制卷

[root@node1 ~] # gluster volume create dis-rep replica 2 node1:/data/sde1 node2:/data/sde1 node3:/data/sde1 node4:/data/sde1 force
volume create: dis-rep: success: please start the volume to access data

[root@node1 ~] # gluster volume start dis-rep
volume start: dis-rep: success

[root@node1 ~] # gluster volume info dis-rep 
 
Volume Name: dis-rep
Type: Distributed-Replicate
Volume ID: 734e38e6-154c-4425-acca-2342577b14e7
Status: Started
Snapshot Count: 0
Number of Bricks: 2 x 2 = 4
Transport-type: tcp
Bricks:
Brick1: node1:/data/sde1
Brick2: node2:/data/sde1
Brick3: node3:/data/sde1
Brick4: node4:/data/sde1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on

=======================
[root@node1 ~] # gluster volume list
dis-rep
dis-stripe
dis-volume
rep-volume
stripe-volume

6、部署gluster客户端

部署Gluster客户端(192.168.189.120)

[root@promote ~]#systemctl stop firewalld
[root@promote ~]#setenforce 0

[root@promote ~]#cd /opt
[root@promote opt]#ls
rh
[root@promote opt]#rz -E
rz waiting to receive.
[root@promote opt]#ls
gfsrepo.zip  rh
[root@promote opt]#unzip gfsrepo.zip 

[root@promote opt]#cd /etc/yum.repos.d/
[root@promote yum.repos.d]#ls
local.repo  repos.bak
[root@promote yum.repos.d]#mv * repos.bak/
mv: 无法将目录"repos.bak" 移动至自身的子目录"repos.bak/repos.bak" 下
[root@promote yum.repos.d]#ls
repos.bak
[root@promote yum.repos.d]#vim glfs.repo

[glfs]
name=glfs
baseurl=file:///opt/gfsrepo
gpgcheck=0
enabled=1

========》wq

[root@promote yum.repos.d]#yum clean all && yum makecache

[root@promote yum.repos.d]#yum -y install glusterfs glusterfs-fuse

[root@promote yum.repos.d]#mkdir -p /test/{dis,stripe,rep,dis_stripe,dis_rep}
[root@promote yum.repos.d]#cd /test/
[root@promote test]#ls
dis  dis_rep  dis_stripe  rep  stripe
[root@promote test]#

[root@promote test]#echo "192.168.189.101 node1" >> /etc/hosts
[root@promote test]#echo "192.168.189.102 node2" >> /etc/hosts
[root@promote test]#echo "192.168.189.103 node3" >> /etc/hosts
[root@promote test]#echo "192.168.189.104 node4" >> /etc/hosts
[root@promote test]#
[root@promote test]#mount.glusterfs node1:dis-volume /test/dis
[root@promote test]#mount.glusterfs node1:stripe-volume /test/stripe
[root@promote test]#mount.glusterfs node1:rep-volume /test/rep
[root@promote test]#mount.glusterfs node1:dis-stripe /test/dis_stripe
[root@promote test]#mount.glusterfs node1:dis-rep /test/dis_rep
[root@promote test]#
[root@promote test]#df -h
文件系统             容量  已用  可用 已用% 挂载点
/dev/sda2             16G  3.5G   13G   22% /
devtmpfs             898M     0  898M    0% /dev
tmpfs                912M     0  912M    0% /dev/shm
tmpfs                912M   18M  894M    2% /run
tmpfs                912M     0  912M    0% /sys/fs/cgroup
/dev/sda5             10G   37M   10G    1% /home
/dev/sda1             10G  174M  9.9G    2% /boot
tmpfs                183M  4.0K  183M    1% /run/user/42
tmpfs                183M   40K  183M    1% /run/user/0
/dev/sr0             4.3G  4.3G     0  100% /mnt
node1:dis-volume     6.0G   65M  6.0G    2% /test/dis
node1:stripe-volume  8.0G   65M  8.0G    1% /test/stripe
node1:rep-volume     3.0G   33M  3.0G    2% /test/rep
node1:dis-stripe      21G  130M   21G    1% /test/dis_stripe
node1:dis-rep         11G   65M   11G    1% /test/dis_rep

[root@promote test]#cd /opt
[root@promote opt]#dd if=/dev/zero of=/opt/demo1.log bs=1M count=40
记录了40+0 的读入
记录了40+0 的写出
41943040字节(42 MB)已复制,0.0311576 秒,1.3 GB/秒
[root@promote opt]#dd if=/dev/zero of=/opt/demo2.log bs=1M count=40
记录了40+0 的读入
记录了40+0 的写出
41943040字节(42 MB)已复制,0.182058 秒,230 MB/秒
[root@promote opt]#dd if=/dev/zero of=/opt/demo3.log bs=1M count=40
记录了40+0 的读入
记录了40+0 的写出
41943040字节(42 MB)已复制,0.196193 秒,214 MB/秒
[root@promote opt]#dd if=/dev/zero of=/opt/demo4.log bs=1M count=40
记录了40+0 的读入
记录了40+0 的写出
41943040字节(42 MB)已复制,0.169933 秒,247 MB/秒
[root@promote opt]#dd if=/dev/zero of=/opt/demo5.log bs=1M count=40
记录了40+0 的读入
记录了40+0 的写出
41943040字节(42 MB)已复制,0.181712 秒,231 MB/秒
[root@promote opt]#
[root@promote opt]#cp demo* /test/dis
[root@promote opt]#cp demo* /test/stripe/
[root@promote opt]#cp demo* /test/rep/
[root@promote opt]#cp demo* /test/dis_stripe/
[root@promote opt]#cp demo* /test/dis_rep/

[root@promote opt]#cd /test/
[root@promote test]#tree
.
├── dis
│   ├── demo1.log
│   ├── demo2.log
│   ├── demo3.log
│   ├── demo4.log
│   └── demo5.log
├── dis_rep
│   ├── demo1.log
│   ├── demo2.log
│   ├── demo3.log
│   ├── demo4.log
│   └── demo5.log
├── dis_stripe
│   ├── demo1.log
│   ├── demo2.log
│   ├── demo3.log
│   ├── demo4.log
│   └── demo5.log
├── rep
│   ├── demo1.log
│   ├── demo2.log
│   ├── demo3.log
│   ├── demo4.log
│   └── demo5.log
└── stripe
    ├── demo1.log
    ├── demo2.log
    ├── demo3.log
    ├── demo4.log
    └── demo5.log

5 directories, 25 files
[root@promote test]#

7、查看文件分布

1、查看分布式文件分布(node1:/dev/sdb1、node2:/dev/sdb1)

[root@node1 ~] # ls -lh /data/sdb1

2、查看条带卷文件分布(node1:/dev/sdc1、node2:/dev/sdc1)

[root@node1 ~] # ls -lh /data/sdc1

3、查看复制卷文件分布(node3:/dev/sdb1、node4:/dev/sdb1)

[root@node3 ~]#ll -h /data/sdb1

4、查看分布式条带卷分布(node1:/dev/sdd1、node2:/dev/sdd1、node3:/dev/sdd1、node4:/dev/sdd1)

[root@node1 ~] # ll -h /data/sdd1

5、查看分布式复制卷分布(node1:/dev/sde1、node2:/dev/sde1、node3:/dev/sde1、node4:/dev/sde1)

六、冗余测试

在客户端(192.168.189.120)上查看文件是否正常

1、分布式卷数据查看,缺少demo5,这是在node2上的,不具备冗余
挂起 node2 节点或者关闭glusterd服务来模拟故障

[root@node2 ~]# init 0

[root@promote test]#ll /test/dis

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值