体系结构
1.1体系结构 :
1.2数据模型
MongoDB 的最小存储单位就是文档 (document) 对象。文档 (document) 对象对应于关系型数据库的行。数据在 MongoDB 中以BSON( Binary-JSON )文档的格式存储在磁盘上。BSON ( Binary Serialized Document Format )是一种类 json 的一种二进制形式的存储格式,简称 Binary JSON 。 BSON 和 JSON 一样,支持内嵌的文档对象和数组对象,但是BSON 有 JSON 没有的一些数据类型,如 Date 和 BinData 类型。BSON 采用了类似于 C 语言结构体的名称、对表示方法,支持内嵌的文档对象和数组对象,具有轻量性、可遍历性、高效性的三个特点,可以有效描述非结构化数据和结构化数据。这种格式的优点是灵活性高,但它的缺点是空间利用率不是很理想。Bson 中,除了基本的 JSON 类型: string,integer,boolean,double,null,array 和 object , mongo 还使用了特殊的数据类型。这些类型包括date,object id,binary data,regular expression 和 code 。每一个驱动都以特定语言的方式实现了这些类型,查看你的驱动的文档来获取详细信息。
BSON数据类型参考列表:
1.3MongoDB的特点
MongoDB 主要有如下特点:( 1 ) 高性能 :MongoDB 提供高性能的数据持久性。特别是 对嵌入式数据模型的支持减少了数据库系统上的I/O 活动。索引支持更快的查询,并且可以包含来自嵌入式文档和数组的键。(文本索引解决搜索的需求、TTL 索引解决历史数据自动过期的需求、地理位置索引可用于构建各种 O2O 应用)mmapv1 、 wiredtiger 、 mongorocks ( rocksdb )、 in-memory 等多引擎支持满足各种场景需求。Gridfs 解决文件存储的需求。( 2 ) 高可用性:MongoDB 的复制工具称为副本集( replica set ),它可提供自动故障转移和数据冗余。( 3 ) 高扩展性:MongoDB 提供了水平可扩展性作为其核心功能的一部分。分片将数据分布在一组集群的机器上。(海量数据存储,服务能力水平扩展)从 3.4 开始, MongoDB 支持基于片键创建数据区域。在一个平衡的集群中, MongoDB 将一个区域所覆盖的读写只定向到该区域内的那些片。( 4 ) 丰富的查询支持:MongoDB 支持丰富的查询语言,支持读和写操作 (CRUD) ,比如数据聚合、文本搜索和地理空间查询等。( 5 )其他特点:如无模式(动态模式)、灵活的文档模型、
单机部署
2.1Windows系统中的安装启动
第一步:官网下载安装包
提示:版本的选择:MongoDB 的版本命名规范如: x.y.z ;y 为奇数时表示当前版本为开发版,如: 1.5.2 、 4.1.13 ;y 为偶数时表示当前版本为稳定版,如: 1.6.3 、 4.0.10 ;z 是修正版本号,数字越大越好。
mongod --dbpath=..\data\db
storage:
#The directory where the mongod instance stores its data.Default Value is "\data\db" on Windows.
dbPath: D:\02_Server\DBServer\mongodb-win32-x86_64-2008plus-ssl-4.0.1\data
mongod -f ../config/mongod.conf
或
mongod --config ../config/mongod.conf
systemLog:
destination: file
#The path of the log file to which mongod or mongos should send all diagnostic logging information
path: "D:/02_Server/DBServer/mongodb-win32-x86_64-2008plus-ssl-4.0.1/log/mongod.log"
logAppend: true
storage:
journal:
enabled: true
#The directory where the mongod instance stores its data.Default Value is "/data/db".
dbPath: "D:/02_Server/DBServer/mongodb-win32-x86_64-2008plus-ssl-4.0.1/data"
net:
#bindIp: 127.0.0.1
port: 27017
setParameter:
enableLocalhostAuthBypass: false
2.2 Shell连接(mongo命令)
在命令提示符输入以下shell命令即可完成登陆
mongo
或
mongo --host=127.0.0.1 --port=27017
查看已经有的数据库:show databases
2.3 Compass-图形化界面客户端
2.4 Linux系统中的安装启动和连接
tar -xvf mongodb-linux-x86_64-4.0.10.tgz
mv mongodb-linux-x86_64-4.0.10 /usr/local/mongodb
#数据存储目录
mkdir -p /mongodb/single/data/db
#日志存储目录
mkdir -p /mongodb/single/log
vi /mongodb/single/mongod.conf
systemLog:
#MongoDB发送所有日志输出的目标指定为文件
# #The path of the log file to which mongod or mongos should send all diagnostic logging information
destination: file
#mongod或mongos应向其发送所有诊断日志记录信息的日志文件的路径
path: "/mongodb/single/log/mongod.log"
#当mongos或mongod实例重新启动时,mongos或mongod会将新条目附加到现有日志文件的末尾。
logAppend: true
storage:
#mongod实例存储其数据的目录。storage.dbPath设置仅适用于mongod。
##The directory where the mongod instance stores its data.Default Value is "/data/db".
dbPath: "/mongodb/single/data/db"
journal:
#启用或禁用持久性日志以确保数据文件保持有效和可恢复。
enabled: true
processManagement:
#启用在后台运行mongos或mongod进程的守护进程模式。
fork: true
net:
#服务实例绑定的IP,默认是localhost
bindIp: localhost,192.168.0.2(服务器局域网Ip 查看命令:ifconfig)
#bindIp
#绑定的端口,默认是27017
port: 27017
[root@bobohost single]# /usr/local/mongodb/bin/mongod -f /mongodb/single/mongod.conf
启动成功about to fork child process, waiting until server is ready for connections.forked process: 90384child process started successfully, parent exiting
[root@bobohost single]# ps -ef |grep mongod
root 90384 1 0 8月26 ? 00:02:13 /usr/local/mongdb/bin/mongod -f /mongodb/single/mongod.conf
# 查看防火墙状态systemctl status firewalld# 临时关闭防火墙systemctl stop firewalld# 开机禁止启动防火墙systemctl disable firewalld
#通过进程编号关闭节点
kill -2 54410
rm -f /mongodb/single/data/db/*.lock
/usr/local/mongdb/bin/mongod --repair --dbpath=/mongodb/single/data/db
//客户端登录服务,注意,这里通过localhost登录,如果需要远程登录,必须先登录认证才行。
mongo --port 27017
//#切换到admin库
use admin
//关闭服务
db.shutdownServer()
基本常用命令
3.1 案例需求
存放文章评论的数据存放到MongoDB中,数据结构参考如下:
数据库:articledb
3.2 数据库操作
数据库名可以是满足以下条件的任意 UTF-8 字符串。不能是空字符串( "") 。不得含有 ' ' (空格 ) 、 . 、 $ 、 / 、 \ 和 \0 ( 空字符 ) 。应全部小写。最多 64 字节。
3.2.1 选择和创建数据库
use 数据库名称
show dbs
或
show databases
注意: 在 MongoDB 中,集合只有在内容插入后才会创建! 就是说,创建集合(数据表)后要再插入一个文档(记录),集合才会真正创建。
db
admin : 从权限的角度来看,这是 "root" 数据库。要是将一个用户添加到这个数据库,这个用户自动继承所有数据库的权限。一些特定的服务器端命令也只能从这个数据库运行,比如列出所有的数据库或者关闭服务器。local: 这个数据永远不会被复制,可以用来存储限于本地单台服务器的任意集合config : 当 Mongo 用于分片设置时, config 数据库在内部使用,用于保存分片的相关信息。
3.2.2 数据库的删除
db.dropDatabase()
3.3 集合操作(类似关系型数据库中的表)
查看当前库中的表:
show collections
或
show tables
集合的命名规范:
集合名不能是空字符串 "" 。集合名不能含有 \0 字符(空字符 ) ,这个字符表示集合名的结尾。集合名不能以 "system." 开头,这是为系统集合保留的前缀。用户创建的集合名字不能含有保留字符。有些驱动程序的确支持在集合名里面包含,这是因为某些系统生成的集合中包含该字符。除非你要访问这种系统创建的集合,否则千万不要在名字里出现 $ 。
3.3.1 集合的显式创建
db.createCollection(name)
3.3.2 集合的隐式创建
3.3.3 集合的删除
db.mycollection.drop()
3.4 文档基本CRUD
3.4.1 文档的插入
使用insert() 或 save() 方法向集合中插入文档
db.collection.insert(
<document or array of documents>,
{
writeConcern: <document>,
ordered: <boolean>
}
)
参数:
示例:要向comment的集合(表)中插入一条测试数据
db.comment.insert({"articleid":"100000","content":"今天天气真好,阳光明
媚","userid":"1001","nickname":"Rose","createdatetime":new Date(),"likenum":NumberInt(10),"state":null})
提示:1 ) comment 集合如果不存在,则会隐式创建2 ) mongo 中的数字,默认情况下是 double 类型,如果要存整型,必须使用函数 NumberInt( 整型数字 ) ,否则取出来就有问题了。3 )插入当前日期使用 new Date()4 )插入的数据没有指定 _id ,会自动生成主键值5 )如果某字段没值,可以赋值为 null ,或不写该字段。
注意:1. 文档中的键 / 值对是有序的。2. 文档中的值不仅可以是在双引号里面的字符串,还可以是其他几种数据类型(甚至可以是整个嵌入的文档 ) 。3. MongoDB 区分类型和大小写。4. MongoDB 的文档不能有重复的键。5. 文档的键是字符串。除了少数例外情况,键可以使用任意 UTF-8 字符。文档键命名规范:键不能含有 \0 ( 空字符 ) 。这个字符用来表示键的结尾。. 和 $ 有特别的意义,只有在特定环境下才能使用。以下划线 "_" 开头的键是保留的 ( 不是严格要求的 ) 。
(2)批量插入
db.collection.insertMany(
[ <document 1> , <document 2>, ... ],
{
writeConcern: <document>,
ordered: <boolean>
}
)

db.comment.insertMany([
{"_id":"1","articleid":"100001","content":"我们不应该把清晨浪费在手机上,健康很重要,一杯温水幸福你我
他。","userid":"1002","nickname":"相忘于江湖","createdatetime":new Date("2019-08-
05T22:08:15.522Z"),"likenum":NumberInt(1000),"state":"1"},
{"_id":"2","articleid":"100001","content":"我夏天空腹喝凉开水,冬天喝温开水","userid":"1005","nickname":"伊人憔
悴","createdatetime":new Date("2019-08-05T23:58:51.485Z"),"likenum":NumberInt(888),"state":"1"},
{"_id":"3","articleid":"100001","content":"我一直喝凉开水,冬天夏天都喝。","userid":"1004","nickname":"杰克船
长","createdatetime":new Date("2019-08-06T01:05:06.321Z"),"likenum":NumberInt(666),"state":"1"},
{"_id":"4","articleid":"100001","content":"专家说不能空腹吃饭,影响健康。","userid":"1003","nickname":"凯
撒","createdatetime":new Date("2019-08-06T08:18:35.288Z"),"likenum":NumberInt(2000),"state":"1"},
{"_id":"5","articleid":"100001","content":"研究表明,刚烧开的水千万不能喝,因为烫
嘴。","userid":"1003","nickname":"凯撒","createdatetime":new Date("2019-08-
06T11:01:02.521Z"),"likenum":NumberInt(3000),"state":"1"}
]);
提示:插入时指定了 _id ,则主键就是该值。如果某条数据插入失败,将会终止插入,但已经插入成功的数据不会回滚掉。因为批量插入由于数据较多容易出现失败,因此,可以使用 try catch 进行异常捕捉处理,测试的时候可以不处理。如(了解):
try {
db.comment.insertMany([
{"_id":"1","articleid":"100001","content":"我们不应该把清晨浪费在手机上,健康很重要,一杯温水幸福你我
他。","userid":"1002","nickname":"相忘于江湖","createdatetime":new Date("2019-08-
05T22:08:15.522Z"),"likenum":NumberInt(1000),"state":"1"},
{"_id":"2","articleid":"100001","content":"我夏天空腹喝凉开水,冬天喝温开水","userid":"1005","nickname":"伊人憔
悴","createdatetime":new Date("2019-08-05T23:58:51.485Z"),"likenum":NumberInt(888),"state":"1"},
{"_id":"3","articleid":"100001","content":"我一直喝凉开水,冬天夏天都喝。","userid":"1004","nickname":"杰克船
长","createdatetime":new Date("2019-08-06T01:05:06.321Z"),"likenum":NumberInt(666),"state":"1"},
{"_id":"4","articleid":"100001","content":"专家说不能空腹吃饭,影响健康。","userid":"1003","nickname":"凯
撒","createdatetime":new Date("2019-08-06T08:18:35.288Z"),"likenum":NumberInt(2000),"state":"1"},
{"_id":"5","articleid":"100001","content":"研究表明,刚烧开的水千万不能喝,因为烫
嘴。","userid":"1003","nickname":"凯撒","createdatetime":new Date("2019-08-
06T11:01:02.521Z"),"likenum":NumberInt(3000),"state":"1"}
]);
} catch (e) {
print (e);
}
3.4.2 文档的基本查询
db.collection.find(<query>, [projection])

(1)查询所有
db.comment.find()
或
db.comment.find({})
按一定条件来查询
db.comment.find({userid:'1003'})
返回符合条件的第一条数据
db.comment.findOne({userid:'1003'})
(2)投影查询(Projection Query):
如:查询结果只显示 _id、userid、nickname :
>db.comment.find({userid:"1003"},{userid:1,nickname:1})
{ "_id" : "4", "userid" : "1003", "nickname" : "凯撒" }
{ "_id" : "5", "userid" : "1003", "nickname" : "凯撒" }
如:查询结果只显示 、userid、nickname ,不显示 _id :
>db.comment.find({userid:"1003"},{userid:1,nickname:1,_id:0})
{ "userid" : "1003", "nickname" : "凯撒" }
{ "userid" : "1003", "nickname" : "凯撒" }
再例如:查询所有数据,但只显示 _id、userid、nickname :
>db.comment.find({},{userid:1,nickname:1})
3.4.3 文档的更新
db.collection.update(query, update, options)
//或
db.collection.update(
<query>,
<update>,
{
upsert: <boolean>,
multi: <boolean>,
writeConcern: <document>,
collation: <document>,
arrayFilters: [ <filterdocument1>, ... ],
hint: <document|string> // Available starting in MongoDB 4.2
}
)
参数:
(1)覆盖的修改
db.comment.update({_id:"1"},{likenum:NumberInt(1001)})
执行后,我们会发现,这条文档除了likenum字段其它字段都不见了
(2)局部修改
db.comment.update({_id:"2"},{$set:{likenum:NumberInt(889)}})
(3)批量的修改
更新所有用户为 1003 的用户的昵称为 凯撒大帝
//默认只修改第一条数据
db.comment.update({userid:"1003"},{$set:{nickname:"凯撒2"}})
//修改所有符合条件的数据
db.comment.update({userid:"1003"},{$set:{nickname:"凯撒大帝"}},{multi:true})
(3)列值增长的修改
db.comment.update({_id:"3"},{$inc:{likenum:NumberInt(1)}})
3.4.4 删除文档
db.集合名称.remove(条件)
以下语句可以将数据全部删除,请慎用
db.comment.remove({})
如果删除_id=1的记录,输入以下语句
db.comment.remove({_id:"1"})
3.5 文档的分页查询
3.5.1 统计查询

(1)统计所有记录数:
db.comment.count()
(2)按条件统计记录数:
db.comment.count({userid:"1003"})
3.5.2 分页列表查询
db.comment.find().limit(3)
//第一页
db.comment.find().skip(0).limit(2)
//第二页
db.comment.find().skip(2).limit(2)
//第三页
db.comment.find().skip(4).limit(2)
3.5.3 排序查询
sort() 方法对数据进行排序, sort() 方法可以通过参数指定排序的字段,并使用 1 和 -1 来指定排序的方式,其中 1 为升序排列,而 -1 是用于降序排列。
db.comment.find().sort({userid:-1,likenum:1})
提示:skip(), limilt(), sort() 三个放在一起执行的时候,执行的顺序是先 sort(), 然后是 skip() ,最后是显示的 limit() ,和命令编写顺序无关。
3.6 文档的更多查询
3.6.1 正则的复杂条件查询(模糊查询)
db.collection.find({field:/正则表达式/})
或
db.集合.find({字段:/正则表达式/})
查询评论内容包含“开水”的所有文档,代码如下:
db.comment.find({content:/开水/})
查询评论的内容中以“专家”开头的,代码如下:
db.comment.find({content:/^专家/})
3.6.2 比较查询
<, <=, >, >= 这个操作符也是很常用的,格式如下:
db. 集合名称 .find({ "field" : { $gt: value }}) // 大于 : field > valuedb. 集合名称 .find({ "field" : { $lt: value }}) // 小于 : field < valuedb. 集合名称 .find({ "field" : { $gte: value }}) // 大于等于 : field >= valuedb. 集合名称 .find({ "field" : { $lte: value }}) // 小于等于 : field <= valuedb. 集合名称 .find({ "field" : { $ne: value }}) // 不等于 : field != value
示例:查询评论点赞数量大于700的记录
db.comment.find({likenum:{$gt:NumberInt(700)}})
3.6.3 包含查询
包含使用$in操作符。 示例:查询评论的集合中userid字段包含1003或1004的文档
db.comment.find({userid:{$in:["1003","1004"]}})
不包含使用$nin操作符。 示例:查询评论集合中userid字段不包含1003和1004的文档
db.comment.find({userid:{$nin:["1003","1004"]}})
3.6.4 条件连接查询
需要查询同时满足两个以上条件,需要使用$and操作符将条件进行关联。(相 当于SQL的and) 格式为:
db.comment.find({$and:[{likenum:{$gte:NumberInt(700)}},{likenum:{$lt:NumberInt(2000)}}]})
如果两个以上条件之间是或者的关系,我们使用 操作符进行关联,与前面 and的使用方式相同 格式为:
$or:[ { },{ },{ } ]
db.comment.find({$or:[ {userid:"1003"} ,{likenum:{$lt:1000} }]})
3.7 常用命令小结
选择切换数据库: use articledb插入数据: db.comment.insert({bson 数据 })查询所有数据: db.comment.find();条件查询数据: db.comment.find({ 条件 })查询符合条件的第一条记录: db.comment.findOne({ 条件 })查询符合条件的前几条记录: db.comment.find({ 条件 }).limit( 条数 )查询符合条件的跳过的记录: db.comment.find({ 条件 }).skip( 条数 )修改数据: db.comment.update({ 条件 },{ 修改后的数据 }) 或 db.comment.update({ 条件 },{$set:{ 要修改部分的字段 : 数据 })修改数据并自增某字段值: db.comment.update({ 条件 },{$inc:{ 自增的字段 : 步进值 }})删除数据: db.comment.remove({ 条件 })统计查询: db.comment.count({ 条件 })模糊查询: db.comment.find({ 字段名 :/ 正则表达式 /})条件比较运算: db.comment.find({ 字段名 :{$gt: 值 }})包含查询: db.comment.find({ 字段名 :{$in:[ 值 1 ,值 2]}}) 或 db.comment.find({ 字段名 :{$nin:[ 值 1 ,值 2]}})条件连接查询: db.comment.find({$and:[{ 条件 1},{ 条件 2}]}) 或 db.comment.find({$or:[{ 条件 1},{ 条件 2}]})
4 索引-Index
索引支持在 MongoDB 中高效地执行查询。如果没有索引, MongoDB 必须执行全集合扫描,即扫描集合中的每个文档,以选择与查询语句匹配的文档。这种扫描全集合的查询效率是非常低的,特别在处理大量的数据时,查询可以要花费几十秒甚至几分钟,这对网站的性能是非常致命的。如果查询存在适当的索引, MongoDB 可以使用该索引限制必须检查的文档数。索引是特殊的数据结构,它以易于遍历的形式存储集合数据集的一小部分。索引存储特定字段或一组字段的值,按字段值排序。索引项的排序支持有效的相等匹配和基于范围的查询操作。此外, MongoDB 还可以使用索引中的排序返回排序结果。官网文档: https://docs.mongodb.com/manual/indexes/了解:MongoDB 索引使用 B 树数据结构(确切的说是 B-Tree , MySQL 是 B+Tree )
4.1 索引的查看
返回一个集合中的所有索引的数组。
db.collection.getIndexes()
> db.comment.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "articledb.comment"
}
]
结果中显示的是默认 _id 索引。默认 _id 索引:MongoDB在创建集合的过程中,在 _id 字段上创建一个唯一的索引,默认名字为 _id_ ,该索引可防止客户端插入两个具有相同值的文档,您不能在_id 字段上删除此索引。注意:该索引是唯一索引,因此值不能重复,即 _id 值不能重复的。在分片集群中,通常使用 _id 作为片键。
4.2 索引的创建
(1)单字段索引示例:对 userid 字段建立索引:
> db.comment.createIndex({userid:1}){"createdCollectionAutomatically" : false,"numIndexesBefore" : 1,"numIndexesAfter" : 2,"ok" : 1}
> db.comment.getIndexes()[{"v" : 2,"key" : {"_id" : 1},"name" : "_id_","ns" : "articledb.comment"},{"v" : 2,"key" : {"userid" : 1},"name" : "userid_1","ns" : "articledb.comment"}]

(2)复合索引:对 userid 和 nickname 同时建立复合(Compound)索引
> db.comment.createIndex({userid:1,nickname:-1}){"createdCollectionAutomatically" : false,"numIndexesBefore" : 2,"numIndexesAfter" : 3,"ok" : 1}
复合索引中列出的字段顺序具有重要意义。例如,如果复合索引由 { userid: 1, nickname:-1 } 组成,则索引首先按 userid 正序排序,然后在每个userid的值内,再在按nickname倒序排序。
> db.comment.getIndexes()[{"v" : 2,"key" : {"_id" : 1},"name" : "_id_","ns" : "articledb.comment"},{"v" : 2,"key" : {"userid" : 1},"name" : "userid_1","ns" : "articledb.comment"},{"v" : 2,"key" : {"userid" : 1,"nickname" : -1},"name" : "userid_1_nickname_-1","ns" : "articledb.comment"}]

4.3 索引的移除
一、索引的移除

> db.comment.dropIndex({userid:1}){ "nIndexesWas" : 3, "ok" : 1 }
二、所有索引的移除
> db.comment.dropIndexes(){"nIndexesWas" : 2,"msg" : "non-_id indexes dropped for collection","ok" : 1}
4.4 索引的使用
4.4.1 执行计划
db.collection.find(query,options).explain(options)




当查询条件和查询的投影仅包含索引字段时, MongoDB 直接从索引返回结果,而不扫描任何文档或将文档带入内存。 这些覆盖的查询可以非常有效。