mongoDB(4)——mongoDB数据库的结构及GridFS存储机制

chunkoutai2983

于 2017-05-06 15:39:00 发布

阅读量337

点赞数

文章标签：数据库

原文链接：https://my.oschina.net/u/3088173/blog/893863

版权

mongodb安装文件：https://pan.baidu.com/s/1i50wR4p

一）mongodb结构：

Collections：在mongoDB中叫做集合，是文档的集合。它是无模式的，可以存储各种各样的文档。

和关系型数据库中的表相比，关系数据库的每一张表就是一个关系模型的映射，每张表的字段就是对应实体的属性和主外键的集合，每个字段需要提前定义。

而集合中可以保存毫无关系的数据，而且具体要保存什么不需要提前定义。

Document：文档是mongoDB保存数据的基本单元。数据的存储结构为BSON格式，也就是TextView中显示的文本。

保存的数据类型可以为：null、boolean、String、object、32位整数、64位整数、64位浮点数、日期、正则表达式、js代码、二进制数据、数组、内嵌文档、最大值、最小值、未定义类型。

GridFS：由于BSON对象有大小限制，不适合存储大型文件，GridFS文件系统为大型文件提供了存储方案(其存储原理稍后再讲)。fs中保存的是图片、视频等大文件。

二）GridFS存储机制：

MongoDB的文档以BSON格式存储，支持二进制数据类型，所以，可以把文件的二进制格式的数据直接保存到MongoDB的文档中，但是每个文档的长度是有限制的，而我们一般上传的图片、视频等文件又比较大。针对这种情况，mongoDB提供了一种处理大文件的规范——GridFS。

一、实现原理：

将要存储的文件分成若干块儿，每一块作为一个单独的文档来存储，每块默认大小为256k。用两个集合来存储一个文件：fs.files与fs.chunks。

fs.files存放文件信息

_id:唯一标识 length：文件总长度 chunksize：每块儿的大小，默认为256k uploadDate：时间戳 md5：文件内容的md5校验和，值由服务器端生成，用于计算上传块的md5校验和，用户可以校验md5的值确保文件正确上传。 contentType：文件类型还可以添加其他键来标识这个文件,例如，可以是上传者的信息。

fs.chunks：存放文件的数据

_id：唯一标识 files_id：文件集合中的_id n:文件的第几个块儿 data：文件的二进制数据

二、保存文件的流程：

如果文件大于chunksize，则把文件分割成多个chunk，再把这些chunk保存到fs.chunks中，最后再把文件信息存入到fs.files中。

三、读取文件的流程：

先据查询的条件，在fs.files中找到对应的文档，得到“_id”的值，再据这个值到fs.chunks中查找所有“files_id”为“_id”的chunk，并按“n”排序，最后依次读取chunk中“data”对象的内容，还原成原来的文件。

四、注意：

GridFS在上传文件过程中是先把文件数据保存到fs.chunks，最后再把文件信息保存到fs.files中，所以如果在上传文件过程中失败，有可能在fs.chunks中出现垃圾数据。这些垃圾数据可以定期清理掉。

转载于:https://my.oschina.net/u/3088173/blog/893863

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
mongoDB(4)——mongoDB数据库的结构及GridFS存储机制

mongodb安装文件：https://pan.baidu.com/s/1i50wR4p 一）mongodb结构： Collections：在mongoDB中叫做集合，是文档的集合。它是无模式的，可以存储各种各样的文档。和关系型数据库中的表相比，关系数据库的每一张表就是一...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。