mongodb 的 GridFS 详细分析（二）

最新推荐文章于 2024-07-23 16:10:37 发布

weixin_34416754

最新推荐文章于 2024-07-23 16:10:37 发布

阅读量119

点赞数

文章标签：数据库运维 git

原文链接：http://blog.51cto.com/memory/1291949

版权

nginx-gridfs模块的安装使用

项目主页：https://github.com/mdirolf/nginx-gridfs

通过nginx-gridfs，可以直接用http来访问GridFS中的文件。

1. 安装

安装各种依赖包：zlib，pcre，openssl

在ubuntu下可能是以下命令：

sudo apt-get install zlib1g-dev //貌似sudo apt-get install zlib-dev 不能安装

sudo apt-get install libpcre3 libpcre3-dev

sudo apt-get install openssl libssl-dev

安装git（略）

用git下载nginx-gridfs的代码：

git clone git://github.com/mdirolf/nginx-gridfs.git

cd nginx-gridfs

git submodule init

git submodule update

下载nginx：

wget http://nginx.org/download/nginx-1.0.12.zip

tar zxvf nginx-1.0.12.zip

cd nginx-1.0.12

./configure --add-module=<nginx-gridfs的路径>

make

sudo make install

如果编译出错，则在configure时加上--with-cc-opt=-Wno-error 参数。

2. 配置nginx

在server的配置中加上以下

location /pics/ {

gridfs pics

field=filename

type=string;

mongo 127.0.0.1:27017;

}

上面的配置表示：

数据库是pics，通过文件名filename来访问文件，filename的类型是string

目前只支持通过id和filename来访问文件。

启动nginx：/usr/local/nginx/sbin/nginx

用MongoVUE把一个图片001.jpg上传到pics数据库中。

打开：http://localhost/pics/001.jpg

如果成功，则可以看到显示图片了。

3. nginx-gridfs的不足

没有实现http的range support，也就是断点续传，分片下载的功能。

GridFS实现原理

GridFS在数据库中，默认使用fs.chunks和fs.files来存储文件。

其中fs.files集合存放文件的信息，fs.chunks存放文件数据。

一个fs.files集合中的一条记录内容如下，即一个file的信息如下：

 
     01{
 
     02"_id": ObjectId("4f4608844f9b855c6c35e298"),       //唯一id，可以是用户自定义的类型
 
     03"filename": "CPU.txt",      //文件名
 
     04"length": 778,      //文件长度
 
     05"chunkSize": 262144,    //chunk的大小
 
     06"uploadDate": ISODate("2012-02-23T09:36:04.593Z"), //上传时间
 
     07"md5": "e2c789b036cfb3b848ae39a24e795ca6",      //文件的md5值
 
     08"contentType": "text/plain"//文件的MIME类型
 
     09"meta": null//文件的其它信息，默认是没有”meta”这个key，用户可以自己定义为任意BSON对象
 
     10}

对应的fs.chunks中的chunk如下：

 
     1{
 
     2"_id": ObjectId("4f4608844f9b855c6c35e299"),    //chunk的id
 
     3"files_id": ObjectId("4f4608844f9b855c6c35e298"),  //文件的id，对应fs.files中的对象，相当于fs.files集合的外键
 
     4"n": 0,     //文件的第几个chunk块，如果文件大于chunksize的话，会被分割成多个chunk块
 
     5"data": BinData(0,"QGV...")     //文件的二进制数据，这里省略了具体内容
 
     6}