早晨发现activity monitor 中有等待的job,查看details显示couldnot connect to Mediaserver:XXX。

先看看Mediaserver是否正常,在device中media server这项,发现mediaserver的status是active for disk,没有tape,正常情况应该是active for tape and disk,是不是服务器无法识别tape了?

登录到Mediaserver上,在OS层面没有发现异常,运行vmoprcmd tpconfig -l 命令也发现没有异常,查看一下进程:bpps -i MM_all,ltid进程(机械手进程)存在,没有问题,重启服务 bpdown -f -v bpup -f -v后,故障依然。


http://www.symantec.com/business/support/index?page=content&id=TECH168379

这篇文档介绍了修改media server的status

master server上运行

nbemmcmd -updatehost -machinename <mediaserver hostname> -machinetype media -machinestateop set_tape_active -masterserver <masterserver hostname>

问题解决。

后记


解决问题的思考

解决思路是将mediaserver上磁带设备的状态设置为激活,命令里的“set_tape_active”这句。

nbemmcmd是用来设置或更新EMM数据库状态的工具

EMM数据库提供了专门的卷数据库(VolDB)和和介质数据库(MediaDB),主要存放了磁带,磁带机,机械手,介质,介质管理器等有关的信息;磁带设备(机械手,磁带机和磁带)的使用需要EMM,磁盘管理不需要。
出现无法连接的错误信息,不一定是网络出了问题,也肯能是磁带设备有问题。


当mediaserver服务器SAN环境发生变化而EMM数据库没有更新,可能会导致mediaserver status 变为offline或者not active for disk/tape。


进一步思考
如何避免此类问题?日常检查备份策略是否成功并不能预防此类问题,只能出现问题后再去解决,所以除了备份策略的检查以外,应该对磁带设备的状态进行巡检,如机械手、磁带机、磁带的状态是否正常。
mediaserver的变更需要对emm也进行变更。