MongoDB是什么
MongoDB是一个使用C++编写的、开源的、面向文档的NoSQL(Not Only SQL)数据库,也是当前最热门的NoSql数据库之一。
关系型数据库是面向记录的,在关系型数据库中一个item是一条记录,在非关系型数据库中一个item是一个文档,举个例子
uuid | name | age |
---|---|---|
1 | u1 | zhangsan |
在NoSQL中是
- {“uuid”:1,”userId”:”u1”,”name”:zhangsan}
NoSQL简介
NoSQL的意思是“不仅仅是SQL”,是目前流行的“非关系型数据库”的统称。
常见的NoSQL数据库如:Redis、CouchDB、MongoDB、HBase、Cassandra等
为什么需要NoSQL?
简单的说,就是为了解决在web2.0时代,出现的三高要求:
1:对数据库高并发读写的需求
2:对海量数据的高效率存储和访问的需求
3:对数据库的高可扩展性和高可用性的需求
而RDB里面的一些特性,在web2.0里面往往变得不那么重要,比如:
1:数据库事务一致性
2:数据库的实时读写
3:复杂的SQL查询,特别是多表关联查询
CAP定理, 又被称作布鲁尔定理(Eric Brewer)
它指出对于一个分布式计算系统来说,不可能同时满足以下三点:
1:强一致性(Consistency):系统在执行过某项操作后仍然处于一致的,在分布式系统中,更新操作执行成功后所有的用户都应该读取到最新的值,这样的系统被认为具有强一致性
2:可用性(Availability):每一个操作总是能够在一定的时间内返回结果
3:分区容错性(Partition tolerance):系统在存在网络分区的情况下仍然可以接受请求并处理,这里网络分区是指由于某种原因网络被分成若干个孤立区域,而区域之间互不相通
根据CAP原理将数据库分成了满足CA原则、满足CP原则和满足AP原则三大类:
1:CA:单点集群,满足一致性,可用性,通常在可扩展性上不太强大,比如RDB
2:CP:满足一致性和分区容错性,通常性能不是特别高,如分布式数据库
3:AP:满足可用性和分区容错性,通常可能对一致性要求低一些,如大多数的NoSQL
BASE(Basically Available,Soft-state,Eventual consistency )
1:基本可用(Basically Available):系统能够基本运行、一直提供服务。
2:软状态(Soft-state):系统不要求一直保持强一致状态。
3:最终一致性(Eventual consistency):系统需要在某一时刻后达到一致性要求
NoSQL的优点
- 扩展简单方便,尤其是水平横向扩展(纵向扩展是指用更强的机器;横向扩展是指把数据分散到多个机器)
- 读写快速高效,多数都会映射到内存操作
- 成本低廉,用普通机器,分布式集群即可
- 数据模型灵活,没有固定的数据模型
NoSQL的缺点
- 不提供对SQL的支持
- 现有产品还不够成熟稳定,功能也还有待加强
MongoDB特点
- 高性能、易于使用、易于扩展、功能丰富
- 面向集合存储,模式自由
- 支持动态查询,支持javascript表达式查询
- 支持索引
- 支持副本集复制和自动故障恢复
- 自动处理分片
- 支持二进制和大型对象数据
- 文件存储格式为BSON(JSON的一种扩展)
安装MongoDB
Ubuntu
sudo apt-get install mongodb
CentOS
sudo yum install mongodb
启动MongoDB-Server
mongod
启动MongoDB-Client
mongo
关闭MongoDB
pkill mongod
或启动MongoDB-Client,输入
use admin
db.shutdownServer()
启动参数配置
启动MongoDB-Server时mongod后可以加很多参数,如下
- –quiet # 安静输出
- –port arg # 指定服务端口号,默认端口27017
- –bind_ip arg # 绑定服务IP,若绑定127.0.0.1,则只能本机访问,不指定默认本地所有IP
- –logpath arg # 指定MongoDB日志文件,注意是指定文件不是目录
- –logappend # 使用追加的方式写日志
- –pidfilepath arg # PID File 的完整路径,如果没有设置,则没有PID文件
- –keyFile arg # 集群的私钥的完整路径,只对于Replica Set 架构有效
- –unixSocketPrefix arg # UNIX域套接字替代目录,(默认为 /tmp)
- –fork # 以守护进程的方式运行MongoDB,创建服务器进程
- –auth # 启用验证
- –cpu # 定期显示CPU的CPU利用率和iowait
- –dbpath arg # 指定数据库路径
- –diaglog arg # diaglog选项 0=off 1=W 2=R 3=both 7=W+some reads
- –directoryperdb # 设置每个数据库将被保存在一个单独的目录
- –journal # 启用日志选项,MongoDB的数据操作将会写入到journal文件夹的文件里
- –journalOptions arg # 启用日志诊断选项
- –ipv6 # 启用IPv6选项
- –jsonp # 允许JSONP形式通过HTTP访问(有安全影响)
- –maxConns arg # 最大同时连接数 默认2000
- –noauth # 不启用验证
- –nohttpinterface # 关闭http接口,默认关闭27018端口访问
- –noprealloc # 禁用数据文件预分配(往往影响性能)
- –noscripting # 禁用脚本引擎
- –notablescan # 不允许表扫描
- –nounixsocket # 禁用Unix套接字监听
- –nssize arg (=16) # 设置信数据库.ns文件大小(MB)
- –objcheck # 在收到客户数据,检查的有效性,
- –profile arg # 档案参数 0=off 1=slow, 2=all
- –quota # 限制每个数据库的文件数,设置默认为8
- –quotaFiles arg # number of files allower per db, requires –quota
- –rest # 开启简单的rest API
- –repair # 修复所有数据库run repair on all dbs
- –repairpath arg # 修复库生成的文件的目录,默认为目录名称dbpath
- –slowms arg (=100) # 配置文件和控制台日志的慢速值
- –smallfiles # 使用较小的默认文件
- –syncdelay arg (=60) # 数据写入磁盘的时间秒数(0=never,不推荐)
- –sysinfo # 打印一些诊断系统信息
- –upgrade # 如果需要升级数据库
Replicaton 参数 - –fastsync # 从一个dbpath里启用从库复制服务,该dbpath的数据库是主库的快照,可用于快速启用同步
- –autoresync # 如果从库与主库同步数据差得多,自动重新同步,
- –oplogSize arg # 设置oplog的大小(MB)
主/从参数 - –master # 主库模式
- –slave # 从库模式
- –source arg # 从库 端口号
- –only arg # 指定单一的数据库复制
- –slavedelay arg # 设置从库同步主库的延迟时间
Replica set(副本集)选项: - –replSet arg # 设置副本集名称
Sharding(分片)选项 - –configsvr # 声明这是一个集群的config服务,默认端口27019,默认目录/data/configdb
- –shardsvr # 声明这是一个集群的分片,默认端口27018
- –noMoveParanoia # 关闭偏执为moveChunk数据保存