近期对底层各子公司网络进行调整,各子公司之间的网络不再互通,今天就发现个子公司和总部的DC提示复制失效,且KCC并没有生成新的复制拓扑,还在不断的尝试连接旧的复制拓扑。导致整个复制的失效。

处理过程:

   实际的排查过程比较折腾,刚开始没有能找到一个完整的思路进行调试,我一直认为KCC应当是会依据当前的网络环境动态的调整复制拓扑,所以一直纠结为啥KCC没有能够生成新的拓扑。最终一位朋友给提示KCC要想生成最新的复制拓扑,必须要提供站点、站点链接、桥头堡等相关信息才可以。我对自己的站点设置进行了排查,发现缺少了桥头堡设置、站点链接也设置错误,综合起来这些错误的信息造成了KCC无法更新复制拓扑。

   1.首先依据当前的站点划分情况分别为各站点设置桥头堡主机,用于承担站点间复制任务

   2.其次依据当前的网络情况,建立站点链接对象,并将能互通的站点加入到此站点中

   3.最后,由于KCC受之前的错误信息影响,当前处于“保持连接模式”,需要人工干预去除掉错误的连接。


故障时复制拓扑:

171858722.jpg

故障排除后KCC生成的复制拓扑:

171616920.jpg