1,chops电话说GRL91A job abend

2, 登录backup server

3, cd /omni_shared/scripts/JP ,用esc两下补全命令,shift+backspace是退回, esc+k是回退上一条命令;

4, cat GRL91A, 会有datalist的名字,是auto20701_bc_dly

5,  (不必需) cd /omni_shared/etc_opt_omni_server ,下面有上面的datalist

6, cd /home/work

7, /cs 10 |grep auto20701_bc_dly, 其中输出的内容,9天是complete,1天是fail,前面有session ID      , 2016/2/3-184

2016/2/16更新:

如果看到某个job执行时间比平时延迟了,这也是造成shout job abend出现的原因。

8, omnidb -sess 2016/2/3-184 -report ,这里关键讲解一下

wKioL1ayCqDhdTWgAAFUY-gds3I805.png

上面的aut20701_vg2_001是device的名字,13.5G,aut20701_vg2是dg的名字,在unix中,一个device代表一个lun,一个dg可以有几个或一个device组成,上面的例子是一个device组成。


上面图没截完全,有3三个gd,每个dg都是只有一个device,这个job是备份这三个device的,即备份3个lun,见下图,3*13.5G,用了两盘磁带。

wKioL1ayDkKxf00lAACPvG_jJU4031.png



在windows的情况,例如新增一个100G的E盘,需要划给6个lun,这个是meta lun。


重新回来,有很多normal的步骤,但是有一个warning,这个就是导致fail的原因。,如下图:

wKiom1ayDyrDHJy9AAAsFsDbw-o165.png

如果是internal error,可以force ok,是些诸如网络原因等的虚假报错。


9,然后去DP,进入internal database-session,ctrl+f,找到刚才的session,双击,如下图:

wKioL1ayFgzzxuzKAAIWDjWdyio269.png

可以看到server名字,三个dg,都是complete的,应该就是Ok的,如果有显示fail的进message看看,那里面和server立omni -see的输出是一样的。

wKiom1ayGmTDMchdAAFGpObxezU708.png

上面这个图说明是用了两盘磁带来备份的,GDCVTL是虚拟带库名字。


2016/2/5更新:

有时在sever命令行中报错的话,例如omni-report汇总那里有failed的,说明在备份几个dg时有个别失败的,可以在dp中找到seesion,点开,单独restart红色的fail dg。