FastDFS分布式文件系统集群容器化部署
一:FastDFS介绍
1.1 什么是FastDFS
FastDFS是用c语言编写的一款开源的分布式文件系统。FastDFS为互联网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用FastDFS很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。由跟踪服务器(tracker server)、存储服务器(storage server)和客户端(client)组成。它主要解决的是海量数据存储的问题。
1.2 FastDFS的系统架构
FastDFS架构包括 Tracker server和Storage server。客户端请求Tracker server进行文件上传、下载,通过Tracker server调度最终由Storage server完成文件上传和下载。
Tracker server作用是负载均衡和调度,通过Tracker server在文件上传时可以根据一些策略找到Storage server提供文件上传服务。可以将tracker称为追踪服务器或调度服务器。
Storage server作用是文件存储,客户端上传的文件最终存储在Storage服务器上,Storage server没有实现自己的文件系统而是利用操作系统 的文件系统来管理文件。可以将storage称为存储服务器。
1.3 Tracker集群
FastDFS集群中的Tracker server可以有多台,Tracker server之间是相互平等关系同时提供服务,Tracker server不存在单点故障。客户端请求Tracker server采用轮询方式,如果请求的tracker无法提供服务则换另一个tracker。
1.4 Storage集群
Storage集群采用了分组存储方式。storage集群由一个或多个组构成,集群存储总容量为集群中所有组的存储容量之和。一个组由一台或多台存储服务器组成,组内的Storage server之间是平等关系,不同组的Storage server之间不会相互通信,同组内的Storage server之间会相互连接进行文件同步,从而保证同组内每个storage上的文件完全一致的。一个组的存储容量为该组内存储服务器容量最小的那个,由此可见组内存储服务器的软硬件配置最好是一致的。
采用分组存储方式的好处是灵活、可控性较强。比如上传文件时,可以由客户端直接指定上传到的组也可以由tracker进行调度选择。一个分组的存储服务器访问压力较大时,可以在该组增加存储服务器来扩充服务能力(纵向扩容)。当系统容量不足时,可以增加组来扩充存储容量(横向扩容)。
1.5 Storage的状态收集
Storage server会连接集群中所有的Tracker server,定时向他们报告自己的状态,包括磁盘剩余空间、文件同步状况、文件上传下载次数等统计信息。
1.6 文件上传流程
客户端上传文件后存储服务器将文件ID返回给客户端,此文件ID用于以后访问该文件的索引信息。文件索引信息包括:组名,磁盘编号,数据两级目录,文件名。这里的文件名是由文件上传的源头服务器、文件上传的时间戳、文件大小、随机数经过base64加密后的一个串。
- 组名:文件上传后所在的storage组名称,在文件上传成功后有storage服务器返回,需要客户端自行保存。
- 磁盘编号:storage配置的上传路store_path*与磁盘编号对应。如果配置了store_path0则是M00,如果配置了store_path1则是M01,以此类推。
因为FastDFS支持多次盘上传,也就是说如果你的服务器有多块儿挂在磁盘,那么可以配置多个Store_path,如store_path0、store_path1…对应的磁盘编号就是M00、M01,这样在上传的时候会上传到多块磁盘上。 - 数据两级目录:storage服务器在每个虚拟磁盘路径下创建的两级目录,用于存储数据文件。
- 文件名:与文件上传时不同。是由存储服务器根据特定信息生成,文件名包含:源存储服务器IP地址、文件创建时间戳、文件大小、随机数和文件拓展名等信息。
1.7 文件下载流程
tracker根据请求的文件路径即文件ID 来快速定位文件。
比如请求下边的文件:
- 通过组名tracker能够很快的定位到客户端需要访问的存储服务器组是group1,并选择合适的存储服务器提供客户端访问。
- 选择完一台存储服务器后,存储服务器根据“磁盘编号M00”可以得知使用的是哪块磁盘是M00这块磁盘。由于M00对应的是store_path0,所以根据store_path0配置的路径就可以找到对应的目录。
- 根据两级目录/02/44/和文件名就可以获取到对应的文件了。
注意:由于FastDFS只提供了文件上传的服务并没有提供文件下载的接口,所以需要在storage上安装nginx来实现文件下载。
二:FastDFS+Nginx实现文件服务器
2.1 系统架构
2.2 架构描述
出于高可用的需求tracker和storage都使用两台服务器,storage使用两个组用以说明storage可以任意扩充组实现线性扩展。
2.3 Client
client请求tracker进行文件上传、下载、删除。
client可以通过java client API方式进行文件上传、下载、删除。
client可以通过http方式进行文件下载。tracker通过nginx提供http下载接口。
client也可以直接访问storage进行文件上传、下载、删除,但建议client通过tracker进行文件上传、下载、删除。
2.4 Tracker Server
每个tracker server互相平等,tracker server上部署nginx不是为了对外提供http文件下载接口,tracker上nginx只是起到负载均衡、反向代理的作用。tracker的nginx会反向代理转发至storage上的nginx。
2.5 Storage Server
每台storage上也部署nginx,storage上的nginx与tracker上的nginx有区别,storage上的nginx需要安装FastDSF-nginx模块,此模块的作用是使用FastDFS和nginx进行整合,nginx对外提供http文件下载接口,注意:nginx只提供文件下载接口不提供上传接口。文件上传仍然通过java client API进行。
2.6 FastDFS安装
https://github.com/happyfish100/fastdfs/wiki
安装fastdfs依赖包:
apt-get install build-essential -y # 安装编译工具
unzip libfastcommon-master.zip
cd libfastcommon-master
./make.sh
./make.sh install
安装 fastdfs:
unzip fastdfs-master.zip
cd fastdfs-master/
./make.sh
./make.sh install
配置跟踪服务器tracker:
mkdir /data/fastdfs/tracker -p
cp /etc/fdfs/tracker.conf.sample /etc/fdfs/tracker.conf
sed -i 's#base_path=/home/yuqing/fastdfs#base_path=/data/fastdfs/tracker#g' /etc/fdfs/tracker.conf
配置存储服务器storage:
mkdir /data/fastdfs/storage -p
cp /etc/fdfs/storage.conf.sample /etc/fdfs/storage.conf
sed -i 's#base_path=/home/yuqing/fastdfs#base_path=/data/fastdfs/storage#g' /etc/fdfs/storage.conf
sed -i 's#store_path0=/home/yuqing/fastdfs#store_path0=/data/fastdfs/storage#g' /etc/fdfs/storage.conf
sed -i 's#tracker_server=192.168.209.121:22122#tracker_server=172.17.2.234:22122#g' /etc/fdfs/storage.conf
2.7 启动stracker和storage
/etc/init.d/fdfs_trackerd start
/etc/init.d/fdfs_storaged start
2.8 测试上传
安装成功后可以通过/usr/bin/fdfs_test测试上传
在tracker机器上或者是storage机器上修改/etc/fdfs/client.conf配置文件
base_path=/data/fastdfs/tracker/
tracker_server=172.17.2.234:22122
测试上传:
root@unode01:~# fdfs_upload_file /etc/fdfs/client.conf 00.jpg
group1/M00/00/00/rBEC6l1JG0KALBhnAABOo6ovw3w035.jpg # 出现这样的文件id说明文件上传成功
目前还不能下载,因为fastDFS没有提供下载接口,需要使用nginx提供下载接口。Tracker和Storage都需要安装nginx。
2.9 在Storage上安装nginx
1、为了做反向代理,请求tracker上的nginx服务,反向代理选择出对应的group组,再根据tracker接收的storage的同步信息情况,最终决定一台storage服务器。然后给客户端返回storage的ip和端口。
2、做tracker的负载均衡。
apt install build-essential -y
apt install libtool -y
apt install libpcre3 libpcre3-dev -y
apt install zlib1g-dev -y
apt-get install openssl libssl-dev -y
useradd nginx -M -s /usr/sbin/nologin
tar xf nginx-1.12.0.tar.gz
unzip fastdfs-nginx-module-master.zip
cd nginx-1.12.0/
./configure --prefix=/application/nginx-1.12.0 --user=nginx --group=nginx --with-http_ssl_module --with-http_v2_module --with-threads --with-file-aio --with-http_stub_status_module --add-module=/root/tools/fastdfs-nginx-module-master/src
make
make isntall
cp fastdfs-nginx-module-master/src/mod_fastdfs.conf /etc/fdfs/
# 修改mod_fastdfs.conf配置文件的内容
connect_timeout=10
tracker_server=172.17.2.234:22122
url_have_group_name=true
store_path0=/data/fastdfs/storage
cp fastdfs-master/conf/http.conf /etc/fdfs/
cp fastdfs-master/conf/mime.types /etc/fdfs/
2.10 修改nginx的配置文件
修改nginx安装目录下的con