故障现象:

所有华为的交换机满屏的警告日志  Reason=Clock selection failed - No selectable clock ,clock status: unsynchronized


处理过程:

1、查华为知识库,有一篇类似的故障:http://support.huawei.com/enterprise/KnowledgebaseReadAction.action?contentId=KB1000063521,抓包的结果也一样为收到的NTP报文的rdsp值超过1秒(我的为3200ms),根据RFC1305规定, 最大的同步距离是1秒,距离的计算公式包含peer.rootdispersion的值,所以一旦rdsp达到1000ms,超过了1秒这个阈值,所以本设备收到报文后认为报文非法并丢弃。

该KB的处理方法是将HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\services\W32Time\Config\LocalClockDispersion 的值由10改为0,改完后在cmd窗口执行命令"w32tm /config /update"来重启时间服务。

使用后仍无效。

2、查询微软KB库,配置 Windows 时间服务以使用外部时间源,配置方法如下:https://support.microsoft.com/zh-cn/kb/816042,NTP Server设置为cn.pool.ntp.org,测试可用,配置完成后故障未能排除。

3、使用gpedit组策略配置-计算机配置--管理模板--windows时间服务,配置完成后问题仍然存在。

4、查询华为设备使用手册http://support.huawei.com/ehedex/hdx.do?lib=DOC1000081668DZE0811M&docid=DOC1000081668&v=03&tocLib=DOC1000081668DZE0811M&tocV=03&id=dc_cfg_ntp_0019&tocURL=resources%252fdc%252fdc%255fcfg%255fntp%255f0019%252ehtml&p=t&fe=1&ui=3&keyword=ntp&clientWidth=1904&browseTime=1476554884374,发现可以使用ntp-service max-distance命令调整rdsp的最大值,调整后交换机不在报错。


故障原因:

收到的NTP报文的rdsp值超过1秒(我的为3200ms),根据RFC1305规定, 最大的同步距离是1秒,距离的计算公式包含peer.rootdispersion的值,一旦rdsp超过1000ms,超过了1秒这个阈值,设备收到报文后认为报文