Veritas 备份出错 status code : 96
通过 “Activity Monitor” 发现在AIX中对Lotus Notes实现文件级备份过程出现错误,状态代码(Status Code)为96。
备份描述:
|
Media Server
|
Policy
|
Pools
|
Backup Type
|
Start/End Time
|
Target
|
|
Sybzx_app
|
OAappFull
|
OA_mailFS_appFS
|
在线全备
|
FS
|
09:30-11:00 week7
|
/app/notesdata
|
|
Sybzx_app
|
OAappIncr
|
OA_mailFS_appFS
|
在线增量
|
FS
|
03:00-04:00 week1/5
|
/app/notesdata
|
|
Media Server
|
Policy
|
Pools
|
Backup Type
|
Start/End Time
|
Target
|
|
Sybzx_mail
|
OAmailFull
|
OA_mailFS_appFS
|
在线全备
|
FS
|
09:30-11:00 week 7
|
/mail/notesdata
|
|
Sybzx_mail
|
OAmailIncr
|
OA_mailFS_appFS
|
在线增量
|
FS
|
03:00-04:00 week 1/5
|
/mail/notesdata
|
故障描述:
Activity Monitor.jpg

JobDetails_jobOverview.jpg

JobDetails_DetailedStatus.jpg

首先执行”available_media”检查对应volume pools中的磁带状态,具体执行输出为:
HP-UX hostname B.11.11 U 9000/800 (ta)
login:
Password:
Please wait...checking for disk quotas
(c)Copyright 1983-2000 Hewlett-Packard Co., All Rights Reserved.
(c)Copyright 1979, 1980, 1983, 1985-1993 The Regents of the Univ. of California
……
RESTRICTED RIGHTS LEGEND
Use, duplication, or disclosure by the U.S. Government is subject to
restrictions as set forth in sub-paragraph (c)(1)(ii) of the Rights in
Technical Data and Computer Software clause in DFARS 252.227-7013.
# cd /usr/openv/netbackup/bin/goodies
# available_media
media media robot robot robot side/ ret size status
ID type type # slot face level KBytes
----------------------------------------------------------------------------
DataStore pool
NetBackup pool
U572L2 HCART2 TLD 0 57 - - - AVAILABLE
U571L2 HCART2 TLD 0 56 - - - DBBACKUP
None pool
OA_mailFS_appFS pool
U557L2 HCART2 TLD 0 42 - 1 209312 ACTIVE
U558L2 HCART2 TLD 0 43 - 1 14368 ACTIVE
U570L2 HCART2 TLD 0 55 - 3 195901760 ACTIVE
U540L2 HCART2 TLD 0 25 - 1 267028576 FULL
U555L2 HCART2 TLD 0 40 - 3 291753984 FULL
|
·介质U540L2与U555L2可用空间均饱和,其”size”值不同,是由于数据压缩率不同,可以通过介质包装察看介质实际存储量与压缩存储量;
Symantec 官方800(bj) 一位姓”张”的工程师解释到,该错误代码表示为容器中没有可用的设备…仅此而已!事实上通过”job details”已经明确指明”不能分配新的介质,存储单元不可用”。且该工程师阐述,针对一个” volume pools”当其中某介质存在”Full”状态时,且数据在”Schedule”中定义的”Retention”尚未到期,则程序将对”Policies”中为对应的作业分配”状态”为空的介质(注意:不是存在剩余空间的介质,而是一个空间未被利用的介质。)当然上述情况发生前,一旦数据在”Schedule”中定义的”Retention”已经过期,则该介质将被释放,并被循环使用。
解决办法:扩展volime pools,为” OA_mailFS_appFS”增加新的介质。
与该工程师提及Basis之间的讨论”由于多个Policies共同应用一个volime pools,当两个policies共同占用一个介质时会发生抢占介质资源的情况,定论为抢占介质资源冲突而导致该错误”。该论证结果被官方认同。
解决办法:调整产生冲突的Policies中的Schedule内部作业计划时间,将产生冲突的Policies作业计划时间撮开。
通过Activity Monitor.jpg分析,首先考虑800的推断,如果这样的话,为什么又会出现下述情况:
19日 app增量执行报错 mail增量执行完成
20日 app全备执行完成 mail全备执行报错
故此,将定论转移为Basis论点…假设为可用介质发生抢占资源冲突…
但通过此后的日志分析,这个假设是不成立的:
22日 app增量执行报错 mail增量执行报错
23日 app全备执行报错 mail全备执行报错
通过华胜工程师确认,该软件设计对于介质抢占资源冲突是考虑过的!当若干policies应用同一介质并先后在很短的时间内同时出发作业…那么首先被执行的policies将被顺利执行,此后出发的策略作业将进入队列,等待介质空闲后执行
应用Reports将MediaServer 中sybzx_app和sybzx_mail的相关日志数据Run出,并进一步进行排查分析,其结果:
Reports>>Image on media >>Client:sybzx_app
Reports_ImgOnMeida_sybzxapp1.JPG

Reports_ImgOnMeida_sybzxapp2.JPG

Reports_ImgOnMeida_sybzxapp3.JPG

·介质 U570L2 中数据到期时间为07年02月21日;
·介质 U540L2 中数据到期时间为07年01月30日;
·介质 U570L2 存储每周(周日)在线全备;
·介质 U570L2 存储手工出发;
·介质 U540L2 存储每日(1-5 )在线增量;
执行”available_media”检查对应volume pools中的磁带状态,具体执行输出为:
# ./available_media
media media robot robot robot side/ ret size status
ID type type # slot face level KBytes
----------------------------------------------------------------------------
OA_mailFS_appFS pool
U557L2 HCART2 TLD 0 42 - 1 209312 ACTIVE
U558L2 HCART2 TLD 0 43 - 1 14368 ACTIVE
U570L2 HCART2 TLD 0 55 - 3 195901760 ACTIVE
U540L2 HCART2 TLD 0 25 - 1 267028576 FULL
U555L2 HCART2 TLD 0 40 - 3 291753984 FULL
|
·介质 U540L2 空间容量饱和;
·介质 U555L2 空间容量饱和;
·介质 U570L2 空间容量可用;
总结:按当前介质状态与对应的策略推断,OAappIncr策略无法执行,因为对应介质U540L2可用空间饱和。OAappFull策略可以执行,因为对应介质U5470L2当前未写满。
Reports>>Image on media >>Client:sybzx_mail
Reports_ImgOnMeida_sybzxmail1.JPG

Reports_ImgOnMeida_sybzxmail2.JPG

Reports_ImgOnMeida_sybzxmail3.JPG

·介质 U555L2 中数据到期时间为07年02月19日;
·介质 U558L2 中数据到期时间为07年01月27日;
·介质 U555L2 存储每周(周日)在线全备;
·介质 U555L2 存储每日(1-5 )在线增量;
·介质 U558L2 存储手工出发;
总结:按当前介质状态与对应的策略推断,OAmailIncr和OAmailFull策略无法执行,因为对应介质U555L2可用空间饱和。
在上述分析中未找到关于介质U557L2的应用,也就是说该介质不对应任何SAN Media Server。将通过” bpmedialist”查询该介质曾经被哪台Media Server使用过。其执行输出为:
# bpmedialist
Server Host = bfbkup
id rl images allocated last updated density kbytes restores
vimages expiration last read <------- STATUS ------->
--------------------------------------------------------------------------------
U541L2 3 29 10/15/2006 00:01 01/21/2007 03:05 hcart2 228911552 0
6 02/21/2007 03:05 N/A
U542L2 3 14 10/15/2006 00:01 01/14/2007 00:09 hcart2 49940576 0
3 02/14/2007 00:09 N/A
U543L2 3 179 09/10/2006 04:03 01/24/2007 10:05 hcart2 |