MongoDB 使用的一些经验(优秀)

转载 2015年07月10日 17:57:11

这是一篇关于 MongoDB 使用经验的一篇文章,MongoDB 相对于 MySQL 简单很多,关于 MySQL 的调优可以看另一篇博文: MYSQL 调优和使用必读



MongoDB 的单进程,多线程模型

读操作可以使用多线程,利用多核心;写操作(Global Locking)和 Map-reduce(JS 解释器的限制)只能使用单线程。

从2.2 版本,MongoDB 部分解决了全局锁问题,可以在写某个库的时候同时写其他库。一般通过在多核心单机上 Sharding 数据库,使用多个 mongod instance, 通过利用多核和缓解全局锁的问题提高读写操作 ops。可以通过 mongostat 命令查看 locking 和 page fault 情况。

另外,使用 htop 可以看到一个进程中的多个线程。Node.js 每个进程其实有两个线程,除了主线程外,还有一个线程池用来处理文件读写等操作。

充分利用 MongoDB 的 oplog

MongoDB 通过 oplog 实现主从同步,但是即使不启用从库,也可以查看和使用 oplog。修改配置文件打开 oplog:

/etc/mongod.conf
# Replication Options
master = true

这样就会在 local database 出现一个名为 oplog.$main 的 collection,(一般 MongoDB 会将这个 collection 中的数据条数保持在 5000 万以下),其中数据类似于:

{
   "ts": {
     "t": 1000,
     "i": 1365409034
  },
   "op": "u",
   "ns": "mydb.mycoll",
   "o2": {
     "_id": ObjectId("50a6718e50e50b4459dcc40e")
  },
   "o": {
     "$set": {
       "myfield": "myfield_value"
    }
  }
}

ts 为自定义的时间戳
op 表示操作类型: insert (i), update (u), delete (d), noop (n)
ns 为操作对应的 collection
o 为操作数据,这里为 $set 操作修改记录

MongoDB 的 MMAP 内存模型

MMAP 的一个缺点很多,比如当读取数据没有在内存中,操作遇到 page fault 的时候也会发生锁操作。

MongoDB 的索引

MongoDB 支持简单的 B-Tree 索引。默认情况下 _id 会自动建索引,如果需要查询其他字段可以自己手动建索引(ensureIndex() )。另外,注意在数据导入导出的时候重建索引。
比 MySQL 好的是 MongoDB 支持多值索引,即使两个字段的顺序是相反的。比如可以支持 .sort({a:1, b:-1}) 这样按不同字段的排序。和 MySQL 类似,使用的时候同样需要避免类似于 skip(BIG_NUM).limit(N) 这样的操作。

MongoDB 需要注意的几点

1. 对线上库的批量操作要控制频率

假如某些读写操作不断占用数据库资源,其他操作将不能很快或者正确完成。可以通过 sleep 操作降低批量操作的频率,为其他操作提供执行空隙。

2. 实时将数据同步到关系型数据库支持复杂查询和数据分析

NoSQL 不支持复杂查询,但是如果需要复杂查询和数据分析,可以将数据同步到关系型数据库中。

MongoDB 原生支持 Streaming,以下 Node.js 代码可以实时获取某个 collection 的数据变化,可以同步到关系型数据库,也可以用来做 Trigger。以下是 MognoDB tail oplog 的核心代码(Node.js):

var options = {
  'ns': self.config.mongodb.db + '.' + self.config.mongodb.collection,
  'ts': {'$gt': new mongo.Timestamp.fromNumber(this.last_timestamp)}
};

var stream = this.mongo.db.collection('oplog.$main')
    .find(options, {tailable: true, awaitdata: true, numberOfRetries: -1}).stream();

stream.on('data', function(item) {
  if (item.op !== 'n' && item.ts.toNumber() !== self.last_timestamp) {
    console.log(adate() + ' ' + JSON.stringify(item)+'\r\n');
    self.process(item, function() {
    });
  }
});

注意读写压力很大的情况下控制 streaming 的速度,具体情况可以见前一篇博文: Node.js 调试 GC 以及内存暴涨的分析。相关代码:

  var stream = this.mongo.db2.collection(self.config.mongodb.collection).find().stream();
  stream.on("data", function(item) {
    stream.pause();
    //console.log(JSON.stringify(item)+'\r\n');
    self.mysql.insert(item, function() {
      stream.resume();
    });
  });

3. 需要为 MongoDB 提供足够的内存空间

如果数据库的数据没有冷热之分,最好配置大于数据大小的内存,防止频繁磁盘操作。
通过将数据记录的键值改短也能明显节约空间。

4. MongoDB 默认操作的异步特性

MongoDB 写操作默认情况下是异步的,所以为了保持一致性,需要加上选项:

{
  safe: {
    fsync: true
  }
}

总之

MongoDB 是一个非常易用,优点和缺点都很明显的数据库。在某些场景下,可以考虑使用 TC,Redis 或者 Postgres,MySQL 替代。

一些参考

http://docs.mongodb.org/manual/faq/concurrency/
https://github.com/mongodb/mongo/blob/master/src/mongo/db/btree.cpp
http://blog.schmichael.com/2011/11/05/failing-with-mongodb/
http://en.wikipedia.org/wiki/Mmap
http://www.polyspot.com/en/blog/2012/understanding-mongodb-storage/

相关文章推荐

深入mongoDB(1)--mongod的线程模型与网络框架

最近工作需要开始研究mongoDB,我准备从其源代码角度,对于mongod和mongos服务的架构、sharding策略、replicaset策略、数据同步容灾、索引等机制做一个本质性的了解。其代码约...

Mongodb写入安全机制--GetLastError

一、简介很多人抱怨mongodb是内存数据库,也没有事务,会不安全,其实这都是对Mongodb的误解,Mongodb有完整的redolog,binlog和持久化机制,不必太担心数据丢失问题。journ...

多线程读多文本写入MongoDB

一、相关说明 前面有一篇博客写的是多线程读文本写入OracleNoSQL,但是写入的效率很慢:三个文件夹(三个线程分别读里面的文本,共有4.3G*3大小的原始数据,花费时间大约为5-6小时)自己就想对...

MongoDB数据库连接池

转载:查看原文 关键词:com.mongodb.DBPortPool$SemaphoresOut: Out of semaphores to get db 今天做MongoDB并发...
  • azhao_dn
  • azhao_dn
  • 2012年02月20日 16:17
  • 10177

MongoDB -- MongoClient连接池用法

主要的调整在于2.10.0版本中引入了MongoClient类,同时在其API中也说明了Mongo类会在将来的版本中被MongoClient替换(Note: This class has been s...

高并发读与高并发写的项目总结和mongodb使用中遇到的坑

最近开发了一个既要高并发写又要高并发读的项目,写的QPS比读还要高,这个需求几乎是变态的,任何缓存的工具都没法使用,数据在一秒内可能变化的几十遍,只能每次请求都实时从数据库读取。下面分如下几点介绍我们...

坑爹的mongodb异步驱动(mongodb-async-driver)

描述下心塞的经历。。。。。 开始: 一直以来mongodb的同步驱动mongo-java-driver,为了提高性能,WriteConcern设置成了NORMAL模式(3.0以后更名为UNACKN...
  • xdstuhq
  • xdstuhq
  • 2017年08月31日 14:08
  • 283

千万别用MongoDB?

某人发了一篇Don’t use MongoDB的血泪控诉,我把原文翻译如下,你可以看看。不过,我想我们还要去看看10gen CTO的对此事的回复,我们还要去在Reddit上看看大家的说法,10gen ...
  • zrjdds
  • zrjdds
  • 2016年08月08日 16:19
  • 2215

MongoDB配置参数详解

MongoDB配置参数详解: #对mongo实例来说,每个host允许链接的最大链接数,这些链接空闲时会放入池中,如果链接被耗尽,任何请求链接的操作会被阻塞等待链接可用,推荐配置10 connec...

关于Mongodb的全面总结

MongoDB的内部构造《MongoDB The Definitive Guide》 MongoDB的官方文档基本是how to do的介绍,而关于how it worked却少之又少,本人也刚...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:MongoDB 使用的一些经验(优秀)
举报原因:
原因补充:

(最多只允许输入30个字)