Mongodb 分片+副本集配置后异常分析

问题发现:

往数据库做插入操作,发现数据全部集中在一个分片,其它分片没有数据。 并且插入效率超级慢!

查看日志发现mongs.log 报出如下的异常描述:

  1. Tue Jul 29 10:14:54.602 [Balancer] caught exception while doing balance: error checking clock skew of cluster xx02:21000,xx03:21000,xx04:21000 :: caused by :: 13650 clock skew of the cluster xx02:21000,xx03:21000,xx04:21000 is too far out of bounds to allow distributed locking.  

解决办法:

断定为是由于服务器时间不同步引起的问题,在每台机器运行:ntpdate  asia.pool.ntp.org 同步系统时间.

问题深究:

  以上问题可以通过mongodb源码进行探源:

报错的信息在client/distlock.cpp的DistributedLock这个类中.

DistributedLock(分布锁)这个类为configdb提供了同步整个集群环境任务状态的方法。每个任务在集群中都必须有一个唯一的名字,比如数据平衡任务'balancer'。

这个锁的信息记录在configdb的locks集合中。每个锁生效都必须在一个预先规定的时间范围内,在初始化类的时候这个类都会自动去维护这个时间,判断是否超时

DistributedLock的got函数

  1. string got( DistributedLock& lock, unsigned long long sleepTime ) {   
  2.     ....   
  3.      // Check our clock skew   
  4.             try {   
  5.                 if( lock.isRemoteTimeSkewed() ) {   
  6.                     throw LockException( str::stream() << "clock skew of the cluster " << conn.toString() << " is too far out of bounds to allow distributed locking." , 13650 );   
  7.                 }   
  8.             }   
  9.             catch( LockException& e) {   
  10.                 throw LockException( str::stream() << "error checking clock skew of cluster " << conn.toString() << causedBy( e ) , 13651);  
  11.             }   
  12.     ....   
  13. }   
  14. bool DistributedLock::isRemoteTimeSkewed() {   
  15.      return !DistributedLock::checkSkew( _conn, NUM_LOCK_SKEW_CHECKS, _maxClockSkew, _maxNetSkew );   
  16. }  
  17.   
  18. /**  
  19.    * Check the skew between a cluster of servers  
  20. */   
  21.         static bool checkSkew( const ConnectionString& cluster, unsigned skewChecks = NUM_LOCK_SKEW_CHECKS, unsigned long long maxClockSkew = MAX_LOCK_CLOCK_SKEW, unsigned long long maxNetSkew = MAX_LOCK_NET_SKEW );  

checkSkew就是判断server之间时间差的函数,此函数有几个参数

1、skewChecks 检查次数 

2、maxClockSkew 最大的时间差

3、maxNetSkew 检查时网络的最大时间差

.每个参数初始化的时候都有默认值,此默认值在distlock.h头文件中

  1. #define LOCK_TIMEOUT (15 * 60 * 1000)   
  2. #define LOCK_SKEW_FACTOR (30)   
  3. #define LOCK_PING (LOCK_TIMEOUT / LOCK_SKEW_FACTOR)   
  4. #define MAX_LOCK_NET_SKEW (LOCK_TIMEOUT / LOCK_SKEW_FACTOR)   
  5. #define MAX_LOCK_CLOCK_SKEW (LOCK_TIMEOUT / LOCK_SKEW_FACTOR)   
  6. #define NUM_LOCK_SKEW_CHECKS (3)  

可以看到skewChecks 默认检查3次,maxClockSkew 的默认值是30s,maxNetSkew 也是30s,时间还是比较短的

maxNetSkew 是从检查机器到被检查机器,执行serverStatus命令返回的最大时间

  1. Date_t then = jsTime();   
  2. bool success = conn->get()->runCommand( string("admin"),BSON( "serverStatus" << 1 ), result );  
  3. delay = jsTime() - then;  

如果delay>2*MAX_LOCK_NET_SKEW 则认为超时

checkSkew通过相互比较集群中server的时间3次,得到集群中差值最大的时间间隔,如果大于maxClockSkew ,那么报出异常

  1. // Make sure our max skew is not more than our pre-set limit   
  2.         if(totalSkew > (long long) maxClockSkew) {   
  3.             log( logLvl + 1 ) << "total clock skew of " << totalSkew << "ms for servers " << cluster << " is out of " << maxClockSkew << "ms bounds." << endl;   
  4.             return false;   
  5.         } 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
【优质项目推荐】 1、项目代码均经过严格本地测试,运行OK,确保功能稳定后才上传平台。可放心下载并立即投入使用,若遇到任何使用问题,随时欢迎私信反馈与沟通,博主会第一时间回复。 2、项目适用于计算机相关专业(如计科、信息安全、数据科学、人工智能、通信、物联网、自动化、电子信息等)的在校学生、专业教师,或企业员工,小白入门等都适用。 3、该项目不仅具有很高的学习借鉴价值,对于初学者来说,也是入门进阶的绝佳选择;当然也可以直接用于 毕设、课设、期末大作业或项目初期立项演示等。 3、开放创新:如果您有一定基础,且热爱探索钻研,可以在此代码基础上二次开发,进行修改、扩展,创造出属于自己的独特应用。 欢迎下载使用优质资源!欢迎借鉴使用,并欢迎学习交流,共同探索编程的无穷魅力! 基于业务逻辑生成特征变量python实现源码+数据+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据+超详细注释.zip 基于业务逻辑生成特征变量python实现源码+数据+超详细注释.zip 基于业务逻辑生成特征变量python实现源码+数据+超详细注释.zip
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值