介绍
FastDFS是由淘宝的余庆先生所开发,是一个轻量级、高性能的开源分布式文件系统,用纯C语言开发,包括文件存储、文件同步、文件访问(上传、下载)、存取负载均衡、在线扩容、相同内容只存储一份等功能,适合有大容量存储需求的应用或系统。做分布式系统开发时,其中要解决的一个问题就是图片、音视频、文件共享的问题,分布式文件系统正好可以解决这个需求。同类的分布式文件系统有谷歌的GFS、HDFS(Hadoop)、TFS(淘宝)等。
源码开放下载地址:https://github.com/happyfish100
FastDFS系统架构:
FastDFS上传流程:
1、client询问tracker上传到的storage,不需要附加参数;
2、tracker返回一台可用的storage;
3、client直接和storage通讯完成文件上传。
FastDFS下载流程:
1、client询问tracker下载文件的storage,参数为文件标识(组名和文件名);
2、tracker返回一台可用的storage;
3、client直接和storage通讯完成文件下载。
术语
两个主要的角色:Tracker Server和 Storage Server
Tracker Server:跟踪服务器,主要负责调度storage节点与client通信,在访问上起负载均衡的作用,和记录storage节点的运行状态,是连接client和storage节点的枢纽。
Storage Server:存储服务器,保存文件和文件的meta data(元数据)
Group:文件组,也可以称为卷。同组内服务器上的文件是完全相同的,做集群时往往一个组会有多台服务器,上传一个文件到同组内的一台机器上后,FastDFS会将该文件即时同步到同组内的其它所有机器上,起到备份的作用。
meta data:文件相关属性,键值对(Key Value Pair)方式,如:width=1024, height=768。和阿里云OSS的meta data相似。
FastDFS单节点安装 - 服务器规划:
跟踪服务器(Tracker Server):192.168.1.131
存储服务器(Storage Server):192.168.1.132
操作系统:CentOS6
用户:root
数据存储目录:/fastdfs
安装包:
fastdfs-5.11.tar.gz:FastDFS源码
libfastcommon-1.0.36.tar.gz:(从 FastDFS 和 FastDHT 中提取出来的公共 C 函数库)
fastdfs-nginx-module-master.zip:storage节点http服务nginx模块
标题 ##所有tracker和storage节点都执行如下操作
1、安装所需的依赖包
yum install make cmake gcc gcc-c++
2、安装libfastcommon
tar -zxvf libfastcommon-1.0.36.tar.gz -C /soft
cd libfastcommon-1.0.36
./make.sh
./make.sh install
3、安装FastDFS
tar -zxvf fastdfs-5.11.tar.gz -C /soft
cd fastdfs-5.11
./make.sh
./make.sh install
采用默认安装方式,相应的文件与目录如下:
1>服务脚本:
/etc/init.d/fdfs_storaged
/etc/init.d/fdfs_trackerd
2> 配置文件(示例配置文件):
/etc/fdfs
3> 命令行工具(/usr/bin目录下)
配置tracker服务器
1> 复制tracker样例配置文件,并重命名
cp /etc/fdfs/tracker.conf.sample /etc/fdfs/tracker.conf
2> 修改tracker配置文件
vim /etc/fdfs/tracker.conf
修改的内容如下:
disabled=false # 启用配置文件
port=22122 # tracker服务器端口(默认22122)
base_path=/fastdfs/tracker # 存储日志和数据的根目录
其它参数保留默认配置。
3> 创建base_path指定的目录
mkdir -p /fastdfs/tracker
4> 防火墙中打开tracker服务器端口( 默认为 22122)
shell> vi /etc/sysconfig/iptables
添加如下端口行:
-A INPUT -m state –state NEW -m tcp -p tcp –dport 22122 -j ACCEPT
重启防火墙:
shell> service iptables restart
5> 启动tracker服务器
/etc/init.d/fdfs_trackerd start
初次启动,会在/fastdfs/tracker目录下生成logs、data两个目录。
检查FastDFS Tracker Server是否启动成功:
ps -ef | grep fdfs_trackerd
6> 停止tracker服务器
/etc/init.d/fdfs_trackerd stop
7>添加服务
chkconfig --add /etc/init.d/fdfs_trackerd
8>设置tracker服务开机启动
chkconfig fdfs_trakcerd on
配置storage服务器
1> 复制storage样例配置文件,并重命名
cp /etc/fdfs/storage.conf.sample /etc/fdfs/storage.conf
2> 编辑配置文件
vi /etc/fdfs/storage.conf
修改的内容如下:
disabled=false # 启用配置文件
port=23000 # storage服务端口
base_path=/fastdfs/storage # 数据和日志文件存储根目录
store_path0=/fastdfs/storage # 第一个存储目录
tracker_server=192.168.1.131:22122 # tracker服务器IP和端口
http.server_port=8888 # http访问文件的端口
其它参数保留默认配置。
3> 创建基础数据目录
mkdir -p /fastdfs/storage
4> 防火墙中打开storage服务器端口( 默认为 23000)
shell> vi /etc/sysconfig/iptables
添加如下端口行:
-A INPUT -m state –state NEW -m tcp -p tcp –dport 23000 -j ACCEPT
重启防火墙:
shell> service iptables restart
5> 启动storage服务器
/etc/init.d/fdfs_storaged start
初次启动,会在/fastdfs/storage目录下生成logs、data两个目录。
检查FastDFS Tracker Server是否启动成功:
ps -ef | grep fdfs_storaged
6> 停止storage服务器
/etc/init.d/fdfs_storaged stop
7> 添加storage服务到系统
chkconfig --add /etc/init.d/fdfs_storaged
8> 设置storage服务开机启动
chkconfig fdfs_storaged on
文件上传测试(192.168.1.131)
1> 修改Tracker服务器客户端配置文件
cp /etc/fdfs/client.conf.sample /etc/fdfs/client.conf
vim /etc/fdfs/client.conf
修改以下配置,其它保持默认:
base_path=/fastdfs/tracker
tracker_server=192.168.1.131:22122
2>执行文件上传命令
/usr/bin/fdfs_upload_file /etc/fdfs/client.conf /usr/include/stdio.h
返回文件ID号:group1/M00/00/00/wKgAyVgEjSGANYtkAAB7mZt7HdQ08538.h
(能返回以上文件ID,说明文件已经上传成功)
在所有storage节点安装fastdfs-nginx-module
1> fastdfs-nginx-module 作用说明
FastDFS 通过 Tracker 服务器,将文件放在 Storage 服务器存储,但是同组存储服务器之间需要进入文件复制,有同步延迟的问题。假设Tracker 服务器将文件上传到了 192.168.1.132,上传成功后文件ID已经返回给客户端。此时 FastDFS 存储集群机制会将这个文件同步到同组存储 192.168.1.133,在文件还没有复制完成的情况下,客户端如果用这个文件 ID 在 192.168.1.131 上取文件,就会出现文件无法访问的错误。而 fastdfs-nginx-module 可以重定向文件连接到源服务器取文件,避免客户端由于复制延迟导致的文件无法访问错误
2> 解压fastdfs-nginx-module-master.zip
unzip fastdfs-nginx-module-master.zip -d /soft
3> 安装Nginx
Nginx安装请参考http://blog.csdn.net/u011411849/article/details/79151931
注意:在执行./configure配置nginx参数的时候,需要将fastdfs-nginx-moudle源码作为模块编译进去:
./configure --prefix=/usr/local/nginx --with-http_stub_status_module --with-http_ssl_module --add-module=/soft/fastdfs-nginx-module/src
4> 复制 fastdfs-nginx-module 源码中的配置文件到/etc/fdfs 目录, 并修改
cp /soft/fastdfs-nginx-module/src/mod_fastdfs.conf /etc/fdfs/
shell> vi /etc/fdfs/mod_fastdfs.conf
修改以下配置:
connect_timeout=10 # 客户端访问文件连接超时时长(单位:秒)
base_path=/tmp # 临时目录
tracker_server=192.168.1.131:22122 # tracker服务IP和端口
storage_server_port=23000 # storage服务端口
group_name=group1 # 组名
url_have_group_name=true # 访问链接前缀加上组名
store_path0=/fastdfs/storage # 文件存储路径
其它配置保持默认即可。
5> 复制 FastDFS 的部分配置文件到/etc/fdfs 目录
cd /soft/fastdfs-5.11/conf
cp http.conf mime.types /etc/fdfs/
6> 在/fastdfs/storage文件存储目录下创建软连接,将其链接到实际存放数据的目录
ln -s /fastdfs/storage/data/ /fastdfs/storage/data/M00
7> 配置nginx访问storage文件
server {
listen 8888;
server_name localhost;
location ~/group([0-9])/M00 {
ngx_fastdfs_module;
}
error_page 500 502 503 504 /50x.html;
location = /50x.html {
root html;
}
}
注意事项:
A> 8888 端口值是要与/etc/fdfs/storage.conf 中的http.server_port=8888 相对应,因为 http.server_port 默认为 8888,如果想改成 80,则要对应修改过来。
B> Storage 对应有多个 group 的情况下,访问路径带 group 名,如/group1/M00/00/00/xxx,对应的 Nginx 配置为:
location ~/group([0-9])/M00 {
ngx_fastdfs_module;
}
C> 如查下载时如发现老报 404, 将 nginx.conf 第一行 user nobody 修改为 user root 后重新启动。
8> 防火墙中打开 Nginx 的 8888 端口
vi /etc/sysconfig/iptables
添加:
-A INPUT -m state –state NEW -m tcp -p tcp –dport 8888 -j ACCEPT
重新启动防火墙:
shell> service iptables restart
9> 启动Nginx
service nginx restart
10> 通过浏览器访问测试时上传的文件
测试上传后返回的文件ID为:group1/M00/00/00/wKgAyVgEjSGANYtkAAB7mZt7HdQ08538.h,用浏览访问的地址为:http://192.168.1.132:8888/group1/M00/00/00/wKgAyVgEjSGANYtkAAB7mZt7HdQ08538.h
注意: 千万不要使用 kill -9 命令强杀 FastDFS 进程,否则可能会导致 binlog 数据丢失。