现象:
某设备升级后,domain相关配置全部丢失,导致管理账户无法远程登录,用户无法上线
原因:
升级过程中,在老版本首先会进行锁域操作,将用户踢下线。之后升级软件版本加载新配置文件重启。本次问题就出在新配置文件里。新配置文件是根据老的配置文件人工更改而来。在每个域中都添加了锁域的命令。但是工作人员添加时将下一行的#号前空格误删除。导致配置激活时,设备识别该#好回到了其他模式,后续命令执行失败,domain配置丢失。
这个案例最特殊的一点是,在事前检查环节对比升级前后配置文件时,对比工具没有提示#号行缺少空格。导致检查环节也未发现异常。
总结:
80%的错误实际仍是人为因素。有人手工处理的环节必须要万分注意。
升级前后的配置文件需要仔细比对,尤其是明确知晓是人工修改的地方,不能仅仅依赖工具检查。
升级操作最好还是现场完成,避免出现各种意外无法登录设备。