MongoDB
一、MongoDB简介
MongoDB 是一个基于分布式文件存储的数据库。由 C++ 语言编写。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。它是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。
二、MongoDB的安装
https://www.mongodb.com/download-center#community
1·选择社区版进行下载,下载zip包,解压缩,并创建一个文件夹mongdbdata用于存放数据
2·配置系统环境变量,环境变量配置完cmd键入mongod -help会出现很多帮助文档
3·进入/bin目录下,首先开启mongod.exe,然后是mongo.exe,因为我们需要指定数据存放的位置,所以不建议直接点击这两个.exe文件,可以在改路径下打开命令窗口输入mongod --dbpath 存放数据的路径,为了以后方便,可新建两个文本文档,分别存放mongod --path D:\software\MongoDB\MongoDBdata 和mongo localhost:27017,取名并更改后缀为.bat文件,对于mongo localhost:27017这条指令,可指定ip和用户,默认用户是test,如下:mongo 192.168.31.138:27017/admin
三、MongoDB的基本概念
SQL术语 | MongoDB术语 | 解释说明 |
---|---|---|
database | database | 数据库 |
table | collection | 表/集合 |
row | document | 数据记录行/集合 |
column | field | 列/域 |
index | index | 索引 |
table joins | 表连接,MongoDB不支持 | |
primary key | primary key | 主键,MongoDB自动将_id字段设为主键 |
数据库(database)
一个MongoDB中可以建立多个数据库,MongoDB的默认数据库是db,存储在data目录中,MongoDB的单个实例可以容纳多个独立的数据库,每一个数据库都有自己的集合(表)和权限,不同的数据库放在不同的文件中。
数据库命名的规范:
1)不能是空字符串("")。
2)不得含有’ '(空格)、.、$、/、\和\0 (空字符)。
3)应全部小写。
4)最多64字节。
5)编码字符集为utf-8(默认就是)
特殊数据库:
admin:从权限的角度来看,这是"root"数据库。要是将一个用户添加到这个数据库,这个用户自动继承所有数据库的权限。一些特定的服务器端命令也只能从这个数据库运行,比如列出所有的数据库或者关闭服务器。
local: 这个数据永远不会被复制,可以用来存储限于本地单台服务器的任意集合
config: 当Mongo用于分片设置时,config数据库在内部使用,用于保存分片的相关信息。
文档(document)
文档是一组键值(key-value)对(即 BSON)。MongoDB 的文档不需要设置相同的字段,并且相同的字段不需要相同的数据类型,这与关系型数据库有很大的区别,也是 MongoDB 非常突出的特点。
特点:
1)文档中的键/值对是有序的。
2)文档中的值不仅可以是在双引号里面的字符串,还可以是其他几种数据类型(甚至可以是整个嵌入的文档)。
3)MongoDB区分类型和大小写。
4)MongoDB的文档不能有重复的键。
5)文档的键是字符串。除了少数例外情况,键可以使用任意UTF-8字符。
文档键命名规范:
1)键不能含有\0 (空字符)。这个字符用来表示键的结尾。
2).和$有特别的意义,只有在特定环境下才能使用。
3)以下划线"_"开头的键是保留的(不是严格要求的)。
集合(collection)
集合就是 MongoDB 文档组,类似于 RDBMS (关系数据库管理系统:Relational Database Management System)中的表格。集合存在于数据库中,集合没有固定的结构,这意味着你在对集合可以插入不同格式和类型的数据,但通常情况下我们插入集合的数据都会有一定的关联性。
合法的集合名
1)集合名不能是空字符串""。
2)集合名不能含有\0字符(空字符),这个字符表示集合名的结尾。
3)集合名不能以"system."开头,这是为系统集合保留的前缀。
4)用户创建的集合名字不能含有保留字符。有些驱动程序的确支持在集合名里面包含,这是因为某些系统生成的集合中包含该字符。除非你要访问这种系统创建的集合,否则千万不要在名字里出现$。
capped collections
Capped collections 就是固定大小的collection。它有很高的性能以及队列过期的特性(过期按照插入的顺序). 有点和 “RRD” 概念类似。Capped collections 是高性能自动的维护对象的插入顺序。它非常适合类似记录日志的功能和标准的 collection 不同,你必须要显式的创建一个capped collection,指定一个 collection 的大小,单位是字节。collection 的数据存储空间值提前分配的。
Capped collections 可以按照文档的插入顺序保存到集合中,而且这些文档在磁盘上存放位置也是按照插入顺序来保存的,所以当我们更新Capped collections 中文档的时候,更新后的文档不可以超过之前文档的大小,这样话就可以确保所有文档在磁盘上的位置一直保持不变。
由于 Capped collection 是按照文档的插入顺序而不是使用索引确定插入位置,这样的话可以提高增添数据的效率。MongoDB 的操作日志文件 oplog.rs 就是利用 Capped Collection 来实现的。
要注意的是指定的存储大小包含了数据库的头信息。
eg:
db.createCollection("mycoll", {
capped:true, size:100000})
capped collection的特点:
1)在 capped collection 中,你能添加新的对象。
2)能进行更新,然而,对象不会增加存储空间。如果增加,更新就会失败 。
3)使用 Capped Collection 不能删除一个文档,可以使用 drop() 方法删除 collection 所有的行。
4)删除之后,你必须显式的重新创建这个 collection。
5)在32bit机器中,capped collection 最大存储为 10的9次方个字节。
元数据
数据库的信息是存储在集合中。它们使用了系统的命名空间:dbname.system.*
在MongoDB数据库中名字空间 .system.* 是包含多种系统信息的特殊集合(Collection),如下:
集合命名空间 | 描述 |
---|---|
dbname.system.namespaces | 列出所有名字空间 |
dbname.system.indexes | 列出所有索引 |
dbname.system.profile | 包含数据库概要(profile)信息 |
dbname.system.users | 列出所有可访问数据库的用户 |
dbname.local.sources | 包含复制对端(slave)的服务器信息和状态 |
对于修改系统集合中的对象有如下限制:
在{ {system.indexes}}插入数据,可以创建索引。但除此之外该表信息是不可变的(特殊的drop index命令将自动更新相关信息)。
{ {system.users}}是可修改的。
{ {system.profile}}是可删除的。
MongoDB的数据类型
数据类型 | 描述 |
---|---|
String | 字符串。存储数据常用的数据类型。在 MongoDB 中,UTF-8 编码的字符串才是合法的。 |
Integer | 整型数值。用于存储数值。根据你所采用的服务器,可分为 32 位或 64 位。 |
Boolean | 布尔值。用于存储布尔值(真/假) |
Double | 双精度浮点值。用于存储浮点值。 |
Min/Max/keys | 将一个值与 BSON(二进制的 JSON)元素的最低值和最高值相对比。 |
Array | 用于将数组或列表或多个值存储为一个键。 |
TimeStamp | 时间戳。记录文档修改或添加的具体时间。 |
Object | 用于内嵌文档。 |
Null | 用于创建空值。 |
Symbol | 符号。该数据类型基本上等同于字符串类型,但不同的是,它一般用于采用特殊符号类型的语言 |
Date | 日期时间。用 UNIX 时间格式来存储当前日期或时间。你可以指定自己的日期时间:创建 Date 对象,传入年月日信息。 |
Object ID | 对象 ID。用于创建文档的 ID。 |
Binary Data | 二进制数据。用于存储二进制数据。 |
Code | 代码类型。用于在文档中存储 JavaScript 代码。 |
Regular expression | 正则表达式类型。用于存储正则表达式。 |
几种重要的数据类型:
ObjectId
类似唯一主键,可以很快的去生成和排序,包含 12 bytes,含义是:前 4 个字节表示创建 unix 时间戳,格林尼治时间 UTC 时间,接下来的 3 个字节是机器标识码,紧接的两个字节由进程 id 组成 PID,最后三个字节是随机数。
MongoDB 中存储的文档必须有一个 _id 键。这个键的值可以是任何类型的,默认是个 ObjectId 对象。由于 ObjectId 中保存了创建的时间戳,所以你不需要为你的文档保存时间戳字段,你可以通过 getTimestamp 函数来获取文档的创建时间。
字符串
BSON 字符串都是 UTF-8 编码。
时间戳
BSON 有一个特殊的时间戳类型用于 MongoDB 内部使用,与普通的 日期 类型不相关。 时间戳值是一个 64 位的值。其中:
前32位是一个 time_t 值(与Unix新纪元相差的秒数)
后32位是在某秒中操作的一个递增的序数
在单个 mongod 实例中,时间戳值通常是唯一的。
在复制集中, oplog 有一个 ts 字段。这个字段中的值使用BSON时间戳表示了操作时间。
日期
表示当前距离 Unix新纪元(1970年1月1日)的毫秒数。日期类型是有符号的, 负数表示 1970 年之前的日期。
四、数据库操作
数据库的连接
连接到指定数据库的格式如下:
mongodb://admin:123456@localhost/test
如果直接使用bin目录下的mongo.exe或者自己写的脚本,默认连接到test数据库
数据库操作
创建查看数据库
进入数据库后可以使用show dbs查看已有数据库,类比mysql的show databases;同样,use 数据库名 表示切换到某个特定数据库,如果没有该数据库则创建数据库。
use database_name
use scott
show dbs
刚创建的数据库使用上述查看数据库的命令是查看不到的,我们需要向里面查看数据才能看到
db.scott.insert({"name":"scott"})
这个时候我们才能看的到Scott数据库
删除数据库
删除数据库可以先进入到改数据库中然后使用:
db.dropDatabase()
若刚登陆进来,使用此命令,删除的是test数据库
集合操作
创建查看集合
db.createCollection(name, options)
options参数列表如下:
字段 | 类型 | 描述 |
---|---|---|
capped | 布尔 | (可选)如果为 true,则创建固定集合。固定集合是指有着固定大小的集合,当达到最大值时,它会自动覆盖最早的文档。 当该值为 true 时,必须指定 size 参数。 |
autoIndexId | 布尔 | (可选)如为 true,自动在 _id 字段创建索引。默认为 false。 |
size | 数值 | (可选)为固定集合指定一个最大值,以千字节计(KB)。 如果 capped 为 true,也需要指定该字段。 |
max | 数值 | (可选)指定固定集合中包含文档的最大数量。 |
在插入文档时,MongoDB 首先检查固定集合的 size 字段,然后检查 max 字段。
集合的创建还可以选择先不创建集合,直接插入数据,插入的同时指定集合名字即可,如下:
db.mycol2.insert({"name" : "直接插入数据创建的集合"})
查看集合的命令:
show collections 或者 show tables
删除集合
删除集合的语法格式为:
db.collection.drop()
其中,collection为集合的名字
查询集合数据
db.collection_name.find()
插入数据
插入数据的语法:
db.COLLECTION_NAME.insert(document)
也可先定义一个变量
document=({title: 'MongoDB 教程',
description: 'MongoDB 是一个 Nosql 数据库',
by: '菜鸟教程',
url: 'http://www.runoob.com',
tags: ['mongodb', 'database', 'NoSQL'],
likes: 100
});
执行后再插入
db.COLLECTION_NAME.insert(document)
3.2版本后还提供以下用法:
db.collection.insertOne()#向指定集合中插入一条文档数据
db.collection.insertMany()#向指定集合中插入多条文档数据
更新数据
update方法
db.collection.update(
<query>,
<update>,