可直接点击上方蓝字
(网易游戏运维平台)
关注我们,获一手游戏运维方案
![a9462030678409d5b8ab565f929d69bc.png](https://img-blog.csdnimg.cn/img_convert/a9462030678409d5b8ab565f929d69bc.png)
YL
运维开发工程师,负责游戏系统配置管理平台的设计和开发,目前专注于新 CMDB 系统的开发,平时也关注运维自动化,DevOps,Python 开发等技术。
背景
CMDB 为了使用事务来存储机器的数据,启用了 mongodb4.0 版本,在平均 1.5k qps 并发写的情况下(这只是机器层面的数据,机器的里面有很多子资源的更新,每个子资源的更新会对应一个 mongodb 操作),mongodb 一直处于高负载状态,导致很多操作变得很慢,从慢日志的统计来看,严重的时候,一小时可以产生 14w+ 条慢日志,使得数据消费的速度下降,导致队列出现堆积,优化迫在眉睫。优化的方向主要有两个,一个在业务层面控制数据的写入速度,一个是在数据库端尝试进行优化,提高数据库的写入性能。本篇文章主要聚焦在数据库层面的优化。
mongodb 索引简介
为了方便理解后面的优化思路,先简单介绍 mongodb 的索引,但不会太详细,只会涉及到本次优化中使用到的索引类型。
mongodb 的索引类型分为:
单键索引(Single Field Index)
复合索引(Compound Index)
多键索引(Multikey Index)
地理空间索引(Geospatial Index)
文本索引(Text Indexes)
哈希索引(Hashed Indexes)
如果我们想要定义某个索引为唯一索引,可以使用索引的属性来定义,索引的属性有:
唯一索引
部分索引
稀疏索引
TTL 索引
galaxyx 存储机器资源的集合,主要使用了单键索引(唯一索引),复合索引,多键索引,以下的内容只会涉及到这三种索引,其他索引的介绍请参考 官方文档。
索引的存储
mongodb 索引使用 B-Tree 数据结构来存储,B-Tree 的每个节点都存放创建索引的 key 的值 (value),以及该值对应文档的存储位置信息(mmapv1 和 wiredTiger 生成位置信息的方式不同),存储引擎再通过该位置信息从磁盘中读取对应的文档数据。这种存储方式和 mysql 的非聚集索引类似,不同的是 mysql 索引使用 B+Tree ,只有叶子节点才存放数据,如果使用 innodb 引擎,叶子节点上存放的对应行的 primary key 的值,查找任何一行数据的磁盘 IO 次数与索引的树高度相同,而 mongodb 索引全部节点都可以存储数据,最好的情况下只用进行一次磁盘 IO,最坏的情况也是和索引树高度相同。
下面通过一个例子来解释 mongodb 的索引结构,比如有一个集合(users),文档存放着用户的名字(name),年龄(age),孩子(childrens), 测试数据如下:
1{
"name": "a", "age": 30, "childrens": [{
"name": "a_a", "age": 3}, {
"name": "a_b", "age": 1}]}
2{
"name": "b", "age": 30, "childrens": [{
"name": "b_a", "age": 2}]}
3{
"name": "c", "age": 32, "childrens": [{
"name": "c_a", "age": 4}, {
"name": "c_b", "age": 1}]}
4{
"name": "e", "age": 33, "childrens": [{
"name": "e_a", "age": 5}, {
"name": "e_b", "age": 2}]}
5{
"name": "f", "age": 32, "childrens": [{
"name": "f_a", "age": 4}, {
"name": "f_b", "age": 1}]}
6{
"name": "d", "age": 40, "childrens": [{
"name": "d_a", "age": 10}]}