如果是一个mongo初学者,如果没有仔细看过官方文档在使用mongo的时候会遇到不少问题。这里总结下这段时间使用mongo的心得,列出了几个需要注意的地方。
1. 系统参数及mongo参数设置
系统参数就第一章已经讲过,mongo参数主要是storageEngine和directoryperdb,这两个参数一开始不选定后续就无法再更改。
directoryperdb主要是将数据库分文件夹存放,方便后续的备份及数据迁移。
storageEngine(存储引擎)默认使用的是MMAPv1,推荐使用3.0新加入的引擎wiredTiger。经实际使用wiredTiger(本人所做项目的信息库存储大小61g,索引11g,使用db.stats统计)占用的磁盘空间是MMAP(350g,索引22g)的1/5,索引大小是其1/2,查询速度也提高很多,更重要的是该引擎提供了document级别的锁,当集合插入或更新数据时不需要阻塞读操作了。唯一的问题是市面上支持该引擎查询的工具不多,MongoVUE无法查到该引擎存储的集合,NosqlManager-mongo可以查到但需要.net环境支持。个人觉得熟悉下mongo command用mongo shell就足够了,所以还是强烈推荐使用wiredTiger引擎。
2. 无需对集合进行水平切分
由于之前一直使用关系型数据库,关系型数据库当单表数据量超大时经常使用的一直方法是对数据表进行分表。在使用mongo时便很自然的觉得这招仍然有用。由于该系统的分表都是动态生成的,做到后面发现这招对mongo带来的性能提升远远抵不过维护成本的增加。
分析一下关系型数据库分表会提高性能的最大原因是很多关系型数据库一张表是一个文件,分表可以避免一个文件过大所造成数据提取速度变慢。但是mongo并不是这样存储