大数据-1:分布式文件系统之MFS及对应高可用

1. 简介

MooseFS是一个具有容错性的网络分布式文件系统。它把数据分散存放在多个物理服务器上,而呈现给用户的则是一个统一的资源。目的是提高单体文件系统的上限,解决性能和容量的瓶颈。

特点:

  • 高可靠(数据的多个拷贝被存储在不同的计算机上)
  • 通过附加新的计算机或者硬盘可以实现容量的动态扩展
  • 删除的文件可以根据一个可配置的时间周期进行保留(一个文件系统级别的回收站)
  • 不受访问和写入影响的文件连贯快照

原理:
读:客户端访问master节点,master节点告知client从哪个从节点上读取,然后客户端直接访问chunk节点

请添加图片描述
写:新建时,客户端向master节点发出写的请求,master向chunk节点取得分配信息,再告知客户端,客户端向chunk一个节点写入,并根据副本数自动复制。一个chunk时64M,多了会切分传送,如在dir2文件内新建一个100M的文件:dd if=/dev/zero of=bigfile bs=1M count=100,查看时该文件被分成了两个文件进行存储:mfsfileinfo bigfile
请添加图片描述

请添加图片描述
端口:

  • 9419…9421 - Master Server
  • 9422 - Chunk Servers
  • 9425 - CGI Server

对于master节点最重要的大小需求时内存,由于整个系统的缓存用来提速。每100w个目标(文件,目录,管道,连接等)大概需要300-350M内存;对于master端CPU的消耗主要是用户读写操作;元数据服务器对于硬件的需求大于等于master

2. 准备安装

官网地址:moosefs
首先准备三个虚拟机,分别给2048M内存,其中一个作为主服务器,其他的作为块服务器;主服务器只负责存储元数据,元数据文件不大,大的数据被分为很多个块,主要是文件的数量及具体的位置;真正的数据存在块服务器里;
添加key:curl "https://ppa.moosefs.com/RPM-GPG-KEY-MooseFS" > /etc/pki/rpm-gpg/RPM-GPG-KEY-MooseFS
在3个节点上均配置yum仓库:curl "http://ppa.moosefs.com/MooseFS-3-el7.repo" > /etc/yum.repos.d/MooseFS.repo

对于主节点:yum install moosefs-master moosefs-cgi moosefs-cgiserv moosefs-cli
对于副节点:yum install -y moosefs-chunkserver

2.1 主节点

主配置文件:
请添加图片描述
需要在每个节点上都做master端的解析(重要):
请添加图片描述
启动主节点服务:systemctl start moosefs-master.service
以及用于提供web的cgi接口:systemctl start moosefs-cgiserv.service
请添加图片描述

2.2 从节点

  • 从节点提供块服务器和存储
  • 默认是在根目录消耗内存,但根目录耗尽后节点无法继续使用;所以一般是将数据挂载在单独的硬盘上;
  • 为从节点(server6,7)添加一个虚拟磁盘
    请添加图片描述
    通过fdisk -l可看到新加的硬盘:
    请添加图片描述
    进行分区,使用所有空间:
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值