Oracle备份时出现AIX系统的3D32B80D错误

环境:

数据库: AIX5.3下的64Oracle 10.2.0.1.0

TSM5.4Windows2003

带库: IBM3100

问题描述:

 

1、  aix系统出现3D32B80D错误。如下:

JTXXDBS01:> errpt |more

IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION

3D32B80D   0203175210 P S topsvcs        NIM thread blocked

3D32B80D   0203175110 P S topsvcs        NIM thread blocked

3D32B80D   0203175110 P S topsvcs        NIM thread blocked

3D32B80D   0203175110 P S topsvcs        NIM thread blocked

3D32B80D   0203174810 P S topsvcs        NIM thread blocked

3D32B80D   0203174810 P S topsvcs        NIM thread blocked

 

 

JTXXDBS01:> errpt -aj 3D32B80D|more

---------------------------------------------------------------------------

LABEL:          TS_NIM_ERROR_STUCK_

IDENTIFIER:     3D32B80D

 

Date/Time:       Wed Feb  3 17:52:06 BEIST 2010

Sequence Number: 114902

Machine Id:      0005807BD600

Node Id:         JTXXDBS01

Class:           S

Type:            PERM

Resource Name:   topsvcs

 

Description

NIM thread blocked

 

Probable Causes

A thread in a Topology Services Network Interface Module (NIM) process

was blocked

Topology Services NIM process cannot get timely access to CPU

User Causes

Excessive memory consumption is causing high memory contention

Excessive disk I/O is causing high memory contention

 

        Recommended Actions

        Examine I/O and memory activity on the system

        Reduce load on the system

        Tune virtual memory parameters

        Call IBM Service if problem persists

 

Failure Causes

Excessive virtual memory activity prevents NIM from making progress

Excessive disk I/O traffic is interfering with paging I/O

 

        Recommended Actions

        Examine I/O and memory activity on the system

        Reduce load on the system

        Tune virtual memory parameters

        Call IBM Service if problem persists

 

 

3D32B80D错误主要是由于整个系统的负载很高,从而导致HA的心跳不能正常通讯造成的。

 

 

2、  在备份时,磁盘IO的频繁主要体现在Hdisk0Hdisk1

从图中看出来比较忙的磁盘IOhdisk1hdisk0,内存比较忙的为nocomp(非计算内存)。

 

 

lsps –s 看,

再看下图:

主要比较忙的hdisk1hdisk0 物理卷AIX的交换空间。但交换空间的使用率却为不足30%

 

这里主要说明了AIXpaging space足够,但paging space还是交换很频繁。注意到内存中的nocomp(非计算内存)长达76% 这里的内存长期不释放,导致comp(计算内存)不足,从而频繁的使用paging space

 

 

3、  AIXNMON监控图形

 

备份时的内存严重不足。

 

AIXpaging space频繁交换。

 

 

具体原因:

这是由于每天22:00 数据库进行rman备份,磁盘的IO很频繁,AIX系统的IO分别磁盘的输入、输出和Paging Space(交换空间)的输入、输出,这里备份主要体现在paging space的频繁操作。其中非计算内存达到76%,长期不释放内存。根本原因是非计算内存长期不释放,AIX内存缺少,导致了Paging Space交换频繁。从而导致系统的负载比较高。

 

限制AIXnocomp(非计算)内存最大值。

AIX

minperm% = 20

maxclient% = 80

maxperm% = 80

 

调整更低。

 

解决步骤:

查看原来的AIX的minperm%maxclient% maxperm%的值。如下:

Root用户查看:

>vmo –a

 

minperm% = 20

maxclient% = 80

maxperm% = 80

 

minperm%设置成10maxclient%设置成20maxperm%设置成20

 

root命令行执行:

1

vmo -o minperm%=10

2

vmo -o maxclient%=20

3

vmo -o maxperm%=20

 

 

改变maxperm%20,再次备份时,不再发生3D32B80D错误。

 

 

 

备注:

 

minperm  maxperm 参数的值

操作系统通过把在曾经读写的内存页留在实内存一满足不同要求。如果文件页面在它们的页帧被重新分配前被请求,那就节省了输入输出操作。该文件页面可以来自本地的或远程的(如 NFS)系统。

页帧使用的文件相对用于计算的(工作或程序文本)段的文件的比例是松散地受控于 minperm  maxperm 的值的:

如果 RAM 中文件页面所占的百分比高于 maxperm,页面替换的窃取只用于文件页。 

如果 RAM 中文件页面所占的百分比低于 minperm,页面替换的窃取同时用于文件页和计算页。 

如果 RAM 中文件页面所占的百分比介于 minperm  maxperm之间,页面替换只窃取文件页,除非文件页的重调入数量大于计算页数。

其中Noncomp20%-80%之间,此时内存页交换算法通常只交换文件缓存页,但如果文件缓存页的交换率大于程序页时,程序页也同样被交换。由于SGA属于Comp页,数据文件缓存属于Noncomp页,而在数据大量访问时,文件缓存页的交换率大于程序页(SGA),因此大量的SGA页面被交换;为避免大量SGA页被交换,需要降低maxperm%值到35%以下,这样就只有文件缓存页面被交换,减少了SGA交换的次数。

5)结论

调整maxperm%minperm%的值,可以将MINPERMMAXPERM分别设为5%20%甚至更小,从而使内存更多地被用于OracleSGA而不是系统的文件缓存。

具体命令:# vmo -o minperm%=5 -o maxperm%=20 

注意:加-p参数可以永久更改系统的配置,否则只改动当前的系统配置,重新启动后则失效。

 

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/12778571/viewspace-626795/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/12778571/viewspace-626795/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值