GPFS通用并行文件系统之CentOS上部署GPFS集群

转载 2015年07月07日 10:51:55

GPFS文件系统能够横跨在所有主机上,分布在所有磁盘上,条带化读写,高性能。信令管理机制,并发性好。可配置failgroup组,可用性高。下面是GPFS集群的部署过程......

1.环境准备:
yum install -y compat-libstdc++-33 rpm-build kernel-headers kernel-devel imake gcc-c++  libstdc++ RedHat-lsb

2.GPFS安装:
多台服务器都要安装
rpm -ivh gpfs.base-3.4.0-0.x86_64.rpm
rpm -ivh gpfs.docs-3.4.0-0.noarch.rpm
rpm -ivh gpfs.gpl-3.4.0-0.noarch.rpm
rpm -ivh gpfs.msg.en_us-3.4.0-0.noarch.rpm


[root@Web02_a base]# rpm -qa|grep gpfs
gpfs.msg.en_US-3.4.0-0
gpfs.gpl-3.4.0-0
gpfs.base-3.4.0-0
gpfs.docs-3.4.0-0


3.GPFS升级
多台服务器都要安装
rpm -Uvhgpfs.base-3.4.0-21.x86_64.update.rpm
rpm -Uvh gpfs.docs-3.4.0-21.noarch.rpm
rpm -Uvh gpfs.gpl-3.4.0-21.noarch.rpm
rpm -Uvh gpfs.msg.en_US-3.4.0-21.noarch.rpm


[root@Web02_a update]# rpm -qa|grep gpfs
gpfs.gpl-3.4.0-21
gpfs.msg.en_US-3.4.0-21
gpfs.base-3.4.0-21
gpfs.docs-3.4.0-21


4.编译GPFS源码
多台服务器都要安装
[root@Web02_a update]# cd/usr/lpp/mmfs/src/
[root@Web02_a src]# makeLINUX_DISTRIBUTION=REDHAT_AS_LINUX Autoconfig
[root@Web02_a src]# make World
[root@Web02_a src]# make InstallImages
[root@Web02_a src]# make rpm    #生成rpm包,生成路径会有提示
[root@Web02_a src]# rpm -ivh /usr/src/redhat/RPMS/x86_64/gpfs.gplbin-2.6.18-308.el5-3.4.0-21.x86_64.rpm


[root@Web02_a src]# rpm -qa|grep gpfs
gpfs.gpl-3.4.0-21
gpfs.msg.en_US-3.4.0-21
gpfs.gplbin-2.6.18-308.el5-3.4.0-21
gpfs.base-3.4.0-21
gpfs.docs-3.4.0-21

 


5.配置主机的时间同步
如果服务器之间时间不同步,部署GPFS集群时会失败
[root@Web02_a src]# crontab -l
#time sync by yangrong at 2014-1-24
*/10 * * * * /usr/sbin/ntpdate pool.ntp.org>/dev/null 2>&1


[root@Nagios update]# crontab -l
#time sync by yangrong at 2014-1-24
*/10 * * * * /usr/sbin/ntpdate pool.ntp.org>/dev/null 2>&1

 


6.配置ssh免密钥登陆
注:也可以配置rsh免密钥,且gpfs默认是使用rsh密钥登陆远端主机


[root@Web02_a src]# cd /root/.ssh/
[root@Web02_a .ssh]# ssh-keygen -t rsa
[root@Web02_a .ssh]# cp id_rsa.pubauthorized_keys
[root@Web02_a .ssh]# ssh Web02_a  #登陆自己测试
[root@Web02_a .ssh]# cat /etc/hosts
10.0.0.243 Nagios
10.0.0.236 Web02_a


[root@Web02_a .ssh]# scp -r /root/.sshroot@Nagios:/root  #把密钥拷贝到其它主机
[root@Web02_a .ssh]# ssh Nagios
Last login: Fri Jan 24 13:59:19 2014 from192.168.2.53
[root@Nagios ~]# exit

 


[root@Nagios src]# ssh Web02_a
Warning: Permanently added the RSA host keyfor IP address '10.0.0.236' to the list of known hosts.
Last login: Fri Jan 24 15:03:44 2014 fromlocalhost.localdomain
[root@Web02_a ~]# exit


7.配置GPFS环境变量
[root@Web02_a .ssh]# echo 'exportPATH=$PATH:/usr/lpp/mmfs/bin' >>/etc/profile
[root@Web02_a .ssh]# source /etc/profile
[root@Web02_a .ssh]# mmfs
mmfsadm          mmfsd            mmfsfuncs.Linux  
mmfsck          mmfsenv          mmfsmnthelp      
mmfsctl          mmfsfuncs        mmfsmount
#接下来的操作只需要在一台服务器上操作即可。此时已配置好互信,所有的配置文件信息自动同步到其它的服务器上。
8.创建集群
[root@Web02_a .ssh]# cat /tmp/gpfsfile 
Web02_a:quorum-manager
Nagios:quorum-manager
[root@Web02_a .ssh]# mmcrcluster -N/tmp/gpfsfile -p Web02_a -s Nagios -r /usr/bin/ssh -R /usr/bin/scp
#默认GPFS使用rcp拷贝,使用rsh远程。此处修改远程方式和复制方式
#查询命令:mmlscluster


9.许可配置
[root@Web02_a ~]# mmchlicense server--accept -N Web02_a,Nagios
注:服务节点或quorum节点用server,其它节点用client,client节点只有挂载文件系统的权限,不能更改配置。命令如:
mmchlicense client --accept -N host_a,host_b

 


10.配置nsd盘
当前采用多个分区部署GPFS集群
当前分区:
[root@Web02_a ~]# fdisk -l /dev/sdb


Disk /dev/sdb: 1073 MB, 1073741824 bytes
255 heads, 63 sectors/track, 130 cylinders
Units = cylinders of 16065 * 512 = 8225280bytes


 Device Boot      Start        End      Blocks  Id  System
/dev/sdb1              1          13      104391  83  Linux
/dev/sdb2              14          26      104422+ 83  Linux
/dev/sdb3              27          39      104422+ 83  Linux
/dev/sdb4              40        130      730957+  5  Extended
/dev/sdb5              40          52      104391  83  Linux
/dev/sdb6              53          65      104391  83  Linux
/dev/sdb7              66          78      104391  83  Linux


[root@Nagios ~]# fdisk -l /dev/sdb


Disk /dev/sdb: 1073 MB, 1073741824 bytes
255 heads, 63 sectors/track, 130 cylinders
Units = cylinders of 16065 * 512 = 8225280bytes


 Device Boot      Start        End      Blocks  Id  System
/dev/sdb1              1          13      104391  83  Linux
/dev/sdb2              14          26      104422+ 83  Linux
/dev/sdb3              27          39      104422+ 83  Linux
/dev/sdb4              40        130      730957+  5  Extended
/dev/sdb5              40          52      104391  83  Linux
/dev/sdb6              53          65      104391  83  Linux
/dev/sdb7              66          78      104391  83  Linux


编辑nsd配置
[root@Web02_a ~]# cat /tmp/nsdfile  
/dev/sdb1:Web02_a::dataAndMetadata:01:
/dev/sdb2:Web02_a::dataAndMetadata:01:
/dev/sdb3:Web02_a::dataAndMetadata:01:
/dev/sdb5:Web02_a::dataAndMetadata:01:
/dev/sdb1:Nagios::dataAndMetadata:02:
/dev/sdb2:Nagios::dataAndMetadata:02:
/dev/sdb3:Nagios::dataAndMetadata:02:
#注:此时failgroup组1与组2磁盘数并不相同,但是磁盘不等是没关系的。两个组相当于raid1。


[root@Web02_a ~]# mmcrnsd -F /tmp/nsdfile-v no
#生成NSD文件
[root@Web02_a ~]# cat /tmp/nsdfile
# /dev/sdb1:Web02_a::dataAndMetadata:01:
gpfs1nsd:::dataAndMetadata:01::system
# /dev/sdb2:Web02_a::dataAndMetadata:01:
gpfs2nsd:::dataAndMetadata:01::system
# /dev/sdb3:Web02_a::dataAndMetadata:01:
gpfs3nsd:::dataAndMetadata:01::system
# /dev/sdb5:Web02_a::dataAndMetadata:01:
gpfs4nsd:::dataAndMetadata:01::system
# /dev/sdb1:Nagios::dataAndMetadata:02:
gpfs5nsd:::dataAndMetadata:02::system
# /dev/sdb2:Nagios::dataAndMetadata:02:
gpfs6nsd:::dataAndMetadata:02::system
# /dev/sdb3:Nagios::dataAndMetadata:02:
gpfs7nsd:::dataAndMetadata:02::system
# /dev/sdb5:Nagios::dataAndMetadata:02:
gpfs8nsd:::dataAndMetadata:02::system


11.配置仲裁盘
#仲裁盘作用,当定义的仲裁盘有一半的磁盘不可用时,该集群不可用。
另:有效磁盘数小于等于整个磁盘数一半时,整个文件系统不可用。
[root@Web02_a ~]# mmchconfig tiebreakerDisks="gpfs1nsd;gpfs2nsd;gpfs3nsd"
Verifying GPFS is stopped on all nodes ...
mmchconfig: Command successfully completed
mmchconfig: Propagating the clusterconfiguration data to all
affected nodes.  This is anasynchronous process.


[root@Web02_a tmp]# mmgetstate -a
[root@Web02_a tmp]# mmgetstate -a


Nodenumber  Node name        GPFS state 
------------------------------------------
    1      Web02_a          active
    2      Nagios          active

 


如果mmgetstate -a状态为down,请确保:防火墙关闭,两台服务器时间同步(注意时区也要一致),/etc/hosts中没有对应127.0.0.1字段。
gpfs错误日志路径:/var/adm/ras/mmfs.log.latest
#修改节点IP  mmchnode --daemon-interface=10.0.0.236 -NWeb02_a


12.创建GPFS文件系统
[root@Web02_a tmp]# mmcrfs vol_data -F/tmp/nsdfile -B 256K -m 2 -r 2 -j cluster -T /vol_data -v no


The following disks of vol_data will beformatted on node Web02_a:
  gpfs1nsd: size 104391 KB
  gpfs2nsd: size 104422 KB
  gpfs3nsd: size 104422 KB
  gpfs4nsd: size 104391 KB
  gpfs9nsd: size 104391 KB
  gpfs10nsd: size 104422 KB
  gpfs11nsd: size 104422 KB
  gpfs12nsd: size 104391 KB
Formatting file system ...
Disks up to size 6.4 GB can be added tostorage pool 'system'.
Creating Inode File
Creating Allocation Maps
Creating Log Files
Clearing Inode Allocation Map
Clearing Block Allocation Map
Formatting Allocation Map for storage pool'system'
Completed creation of file system/dev/vol_data.
mmcrfs: Propagating the clusterconfiguration data to all
affected nodes.  This is anasynchronous process.

 


13.挂载文件系统:
[root@Web02_a ras]# mmmount /vol_data -a
Fri Jan 24 20:04:25 CST 2014: mmmount:Mounting file systems ...
[root@Web02_a ras]# df -hT
Filesystem    Type  Size  Used Avail Use% Mounted on
/dev/sda3    ext3    19G  11G  7.0G 60% /
/dev/sda1    ext3  190M  12M  169M  7% /boot
tmpfs      tmpfs    123M    0 123M  0% /dev/shm
/dev/vol_data gpfs    814M 333M  481M  41% /vol_data


[root@Nagios ras]# df -hT
Filesystem    Type  Size  Used Avail Use% Mounted on
/dev/sda3    ext3  6.6G  3.5G  2.8G 56% /
/dev/sda1    ext3  190M  12M  169M  7% /boot
tmpfs      tmpfs    249M    0 249M  0% /dev/shm
/dev/vol_data gpfs    814M 333M  481M  41% /vol_data

安装完成。
14.开机自启动
mmchconfig  autoload=yes
或在/etc/rc.local中添加:/usr/lpp/mmfs/bin/mmstartup -a
15.可靠性测试
down掉Nagiogs服务器测试。看数据是否读取正常
[root@Web02_a ras]# cd /vol_data/
[root@Web02_a vol_data]# cp /etc/hosts .
[root@Web02_a vol_data]# ll
total 0
-rw-r--r-- 1 root root 375 Jan 26 09:25hosts
[root@Web02_a vol_data]# cat hosts 
# Do not remove the following line, orvarious programs
# that require network functionality willfail.
127.0.0.1              localhost.localdomain localhostbogon
::1            localhost6.localdomain6 localhost6
10.0.0.236 Web02_a
10.0.0.243 Nagios
[root@Web02_a vol_data]# ssh Nagios
Last login: Sun Jan 26 09:08:28 2014 fromweb02_a
[root@Nagios ~]# /etc/init.d/networkstop    #down掉Nagios服务器网卡
Shutting down interface eth0:
[root@Web02_a vol_data]# mmgetstate -a  #查看状态已经有一个节点down掉


Nodenumber  Node name        GPFS state 
------------------------------------------
    1      Web02_a          active
    2      Nagios          unknown
[root@Web02_a vol_data]# cat/vol_data/hosts  #还能正常读取,保证集群的高可用。
# Do not remove the following line, orvarious programs
# that require network functionality willfail.
127.0.0.1              localhost.localdomain localhostbogon
::1            localhost6.localdomain6 localhost6
10.0.0.236 Web02_a
10.0.0.243 Nagios

测试OK。

GPFS安装配置

GPFS由IBM开发的集群文件系统 这个集群文件系统在Linux下已经销声匿迹很久了,常玩AIX的同学想必对这个文件系统很是熟悉了。 笔者只是最近有兴趣来测试一下,不过让人心碎的是IBM却不对外开...

构建高可用、高性能的 GPFS 集群

本文通过一个实际的生产系统案例 , 主要介绍了搭建高可用并行文件系统集群(GPFS)的设计思路和设计过程中的问题解决。本文也通过案例介绍了 GPFS 并行文件系统的一些基本框架和原理 ,GPFS 系统...
  • cici_dh
  • cici_dh
  • 2015年07月07日 10:54
  • 798

初窥GPFS文件系统

 转载请注明出处!姜江 linuxemacs@gmail.com 一、什么是GPFS文件系统 General Parallel File System(GPFS)是高性能、可扩展、并行文件系统,起源于...

GPFS文件系统分析

什么是GPFS文件系统 GPFS(General Parallel File System)是IBM公司开发的高性能集群文件系统,从1998年 开始首先应用于AIX集群,2001年后应用于Li...

GPFS文件系统

前言 GPFS(General Parallel File System)是IBM公司推出的行业领先的并行分布式通用并行集群文件系统,GPFS从1993开始研发,1995年投入商用(最早投入使用在多...

GPFS安装搭建(二)

gpfs集群配置:   集群搭建的准备:为了方便我们进行操作,首先设置ssh免密码登录。   在192.168.1.17机器上连接192.168.1.140机器:   192.168.1....
  • dotedy
  • dotedy
  • 2015年12月14日 18:54
  • 469

IBM GPFS并行文件系统

原文地址:http://www.hqschina.com/Show.aspx?info_lb=283&info_id=751&flag=103         IBM GPFS文件系统是一种专门为群...

IBM GPFS并行文件系统解决方案

随着技术的发展,大规模的并行计算的方式激发有关行业对高性能计算机的需求,作为后起之秀的Linux 集群系统,吸取了SP 大规模并行机的诸多优势,IBM的通用并行文件系统GPFS 等和Linux 集群系...
  • cici_dh
  • cici_dh
  • 2015年07月07日 11:01
  • 251

文件系统那些事-第5篇 并行文件系统之蓝色选择GPFS

GPFS[i](General Parallel File System)是一个IBM为在RS/6000 SP服务器上使用的一般目的(general-purpose)的可扩展文件系统。 GPFS继承...
  • fsdev
  • fsdev
  • 2012年03月15日 22:54
  • 2602

初窥GPFS文件系统

作者:姜江 linuxemacs@gmail.com 原文地址:http://blog.csdn.net/jznsmail/article/details/5502840?reload 本作品采用...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:GPFS通用并行文件系统之CentOS上部署GPFS集群
举报原因:
原因补充:

(最多只允许输入30个字)