mongodb 监控权限_mongodb监控常用方法

列举mongodb监控的常用命令

1.监控统计

mongostat 可用于查看当前QPS/内存使用/连接数,以及多个shard的压力分布

命令参考

./mongostat --port 27071 -u admin -p xxx --authenticationDatabase=admin --discover -n 30 3

参数说明

-discover 提供集群中所有节点的状态

-n 30 3 表示输出30次,每次休眠3秒钟

输出示例

insert query update delete getmore command %dirty %used flushes mapped vsize res faults qr|qw ar|aw netIn netOut conn set repl time

185.1.12.101:10001 499 4886 2042 1612 237 756|0 3.8 80.1 0 28.5G 19.1G n/a 3|0 1|1 4m 7m 5545 shard0 PRI 2017-03-06T11:48:17+08:00

指标说明

指标名

说明

inserts/s

每秒插入数

query/s

每秒查询数

update/s

每秒更新数

delete/s

每秒删除数

getmore/s

每秒getmore数

command/s

每秒命令数,涵盖了增删改查和其他操作

dirty/%

WriedTiger引擎参数,缓存中无效数据百分比

used/%

WriedTiger引擎参数,正在使用的缓存百分比

flushs/s

每秒执行fsync将数据写入硬盘次数

mapped/MB

所有的被mmap的数据量

vsize/MB

虚拟内存使用量

res/MB

物理内存使用量

faults/s

每秒访问失败数,与内存swap有关

qrqw

客户端读写等待队列数量,高并发时,一般队列值会升高

araw

客户端读写活跃个数

netIn

网络接收数据量

netOut

网络发送数据量

conn

当前连接数

set

所属集合(分片)

repl

复制状态(主节点/二级节点..)

time

时间戳

2.热点操作

mongotop 用于查看当前占用比例较高的DB操作,即热点操作。

命令参考

./mongotop --port 10001 -u admin -p xxx --authenticationDatabase=admin

输出示例

ns totalreadwrite2017-03-20T15:22:36+08:00

nscl.T_De**ata407ms266ms140ms

nscl.T_OAUT**EN251ms242ms8ms

nscl.T_Subs**tion180ms 180ms0ms

nscl.T_De**istory61ms0ms61ms

3.慢操作检测

profile是mongodb实现慢操作检测的模块,官方说明

连接shell(使用root)

./mongo --port 10001 -u root -p xxx --authenticationDatabase=admin

use admin

注意

profile操作必须连接mongod进程,而mongos无法执行此类操作

profile设置

db.setProfilingLevel(0) 不输出慢查询

db.setProfilingLevel(1,100) 统计慢查询,100ms是阈值

db.setProfilingLevel(2) 统计所有操作

db.getProfilingLevel()

查询慢查询

db.system.profile.find().limit(10).sort( { ts : -1 } ).pretty()

db.system.profile.find().limit(10).sort( { millis : -1 } ).pretty()

查询当前操作

db.currentOp()

样例-查询等待锁的增删改查

db.currentOp(

{

"waitingForLock" : true,

$or: [

{ "op" : { "$in" : [ "insert", "update", "remove" ] } },

{ "query.findandmodify": { $exists: true } }

]

}

)

样例-查询活跃query操作

db.currentOp(true).inprog.forEach(

function(opDoc){

if(!opDoc.active && opDoc.op=='query')

printjson(d)

}

)

4. 集合状态分析

数据库状态

db.stats()

->

{

"db" : "test", //当前数据库

"collections" : 3, //集合数量

"objects" : 165606718, //对象数量

"avgObjSize" : 381, //对象平均大小

"dataSize" : 63142130610, //所有数据总大小

"storageSize" : 16384, //数据占磁盘大小

"numExtents" : 3,

"indexes" : 479, //索引数

"indexSize" : 8011636736, //索引大小

"fileSize" : 201326592 //预分配给数据库的文件大小

}

集合状态

db.xxx.stats()

->

...

"sharded" : true, //是否分片

"capped" : false, //是否限制大小

"ns" : "nscl.T_BUSINESS_LOG",

"count" : 26541837, //表数量

"size" : 14991828070, //表大小

"storageSize" : 3615076352, //占磁盘大小

"totalIndexSize" : 2640109568, //索引大小

"avgObjSize" : 564.8376210734773,

"nindexes" : 6,

"nchunks" : 374 //chunk数量

...

5. 分片均衡

利用sh.status或db.printShardingStatus()查看当前分片均衡状态

输出样例

--- Sharding Status ---

sharding version: {

"_id" : 1,

"minCompatibleVersion" : 5,

"currentVersion" : 6,

"clusterId" : ObjectId("5aa8dea3102264450d128285")

}

shards:

{ "_id" : "shard0", "host" : "shard0/135.177.126.24:10001,135.177.126.25:10001", "state" : 1 }

most recently active mongoses:

"3.4.10" : 3

autosplit:

Currently enabled: yes

balancer:

Currently enabled: yes

Currently running: no

Balancer lock taken at Sun Mar 25 2018 12:12:57 GMT+0800 by ConfigServer:Balancer

Balancer active window is set between 01:00 and 06:00 server local time

Failed balancer rounds in last 5 attempts: 0

Migration Results for the last 24 hours:

No recent migrations

databases:

{ "_id" : "app1", "primary" : "shard0", "partitioned" : true }

{ "_id" : "app2", "primary" : "shard0", "partitioned" : true }

app2.T_APIStat

shard key: { "recordTime" : "hashed" }

unique: false

balancing: true

chunks:

分段

说明

shards

分片列表信息,包含主备节点

active mongose

当前活跃的mongos进程

autosplit

自动切分chunk开关

balancer

当前均衡器状态信息,包括最近均衡的统计

databases

数据库分库信息,包括每个集合的分片信息、chunks分布

6. 副本集同步

利用sh.status查看当前副本集状态

{

"set" : "shard0",

"date" : ISODate("2018-04-10T06:56:37.674Z"),

"myState" : 2,

"term" : NumberLong(11),

"syncingTo" : "135.177.126.25:10001",

"heartbeatIntervalMillis" : NumberLong(2000),

"optimes" : {

"lastCommittedOpTime" : {

"ts" : Timestamp(1523343395, 1),

"t" : NumberLong(11)

},

"appliedOpTime" : {

"ts" : Timestamp(1523343395, 1),

"t" : NumberLong(11)

},

"durableOpTime" : {

"ts" : Timestamp(1523343395, 1),

"t" : NumberLong(11)

}

},

"members" : [

{

"_id" : 0,

"name" : "135.177.126.24:10001",

"health" : 1.0,

"state" : 2,

"stateStr" : "SECONDARY",

"uptime" : 276079,

"optime" : {

"ts" : Timestamp(1523343395, 1),

"t" : NumberLong(11)

},

"optimeDate" : ISODate("2018-04-10T06:56:35.000Z"),

"syncingTo" : "135.177.126.25:10001",

"configVersion" : 1,

"self" : true

},

{

"_id" : 1,

"name" : "135.177.126.25:10001",

"health" : 1.0,

"state" : 1,

"stateStr" : "PRIMARY",

"uptime" : 276057,

"optime" : {

"ts" : Timestamp(1523343395, 1),

"t" : NumberLong(11)

},

"optimeDurable" : {

"ts" : Timestamp(1523343395, 1),

"t" : NumberLong(11)

},

"optimeDate" : ISODate("2018-04-10T06:56:35.000Z"),

"optimeDurableDate" : ISODate("2018-04-10T06:56:35.000Z"),

"lastHeartbeat" : ISODate("2018-04-10T06:56:37.320Z"),

"lastHeartbeatRecv" : ISODate("2018-04-10T06:56:36.007Z"),

"pingMs" : NumberLong(0),

"electionTime" : Timestamp(1523067325, 1),

"electionDate" : ISODate("2018-04-07T02:15:25.000Z"),

"configVersion" : 1

},

{

"_id" : 2,

"name" : "135.177.126.26:10001",

"health" : 1.0,

"state" : 7,

"stateStr" : "ARBITER",

"uptime" : 276057,

"lastHeartbeat" : ISODate("2018-04-10T06:56:35.890Z"),

"lastHeartbeatRecv" : ISODate("2018-04-10T06:56:35.020Z"),

"pingMs" : NumberLong(0),

"configVersion" : 1

}

],

"ok" : 1.0

}

分段

说明

set

当前副本集名称

date

执行命令时间

myState

当前节点的状态(角色)

syncingTo

同步源

heartbeatIntervalMillis

心跳间隔

members

节点成员

members.id

成员编号

members.name

成员名称

members.heath

健康状态,1-true,0-false

members.state

成员状态(角色)1-主节点 2-备节点 7-仲裁节点

members.stateStr

成员状态名

members.uptime

成员启动运行时长

members.optime

成员oplog时间戳(字段ts)

members.optimeDate

成员oplog时间(格式化)

members.lastHeartbeat

当前节点对成员的最后一个心跳

members.lastHeartbeatRecv

当前节点收到该成员的最后一个心跳

members.pingMs

当前节点到该成员的回路时长

members.syncingTo

成员同步源

members.electionTime

主节点选举时间戳(ms)

members.electionDate

主节点选举时间(格式化)

检查每个成员的state/stateStr确认是否正常;

关于state状态值参考

检查每个成员的optimeDate差异,查看复制延迟;

检查lastHeartbeat、pingMs值排查网络延迟问题

使用db.printReplicationInfo()输出节点oplog信息,可在主备节点输出对比

configured oplog size: 20480MB

log length start to end: 589911secs (163.86hrs)

oplog first event time: Tue Apr 03 2018 19:37:14 GMT+0800

oplog last event time: Tue Apr 10 2018 15:29:05 GMT+0800

now: Tue Apr 10 2018 15:30:18 GMT+0800

主节点使用db.printSlaveReplicationInfo()可输出备节点的同步信息

source: 135.177.126.24:10001

syncedTo: Tue Apr 10 2018 15:32:45 GMT+0800

0 secs (0 hrs) behind the primary

7.其他参考

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值