有台P615的小机,发现ERRPT每天15点报错:
Errpt –aj F89FB899
LABEL: DMPCHK_NOSPACE
IDENTIFIER: F89FB899
Date/Time: Mon Apr 4 15:00:02 CUT
Sequence Number: 1739
Machine Id: 005FC74D4C00
Node Id: FRDP-1
Class: O
Type: PEND
Resource Name: dumpcheck
Description
The copy directory is too small.
Probable Causes
There is not enough free space in the file system containing the copy directory to accommodate the dump.
Recommended Actions
Increase the size of that file system.
Detail Data
File system name
/var/adm/ras
Current free space in kb
20156
Current estimated dump size in kb
26214
解决方法1,扩展/var的空间;方法2,取消dumpcheck操作。
取消dumpcheck处理操作的过程:
Smit-------system environments----------change/show characteristics of system dump----check dump resource utility:
将check dump resource由yes改为no.
另有相关设置:
Change the Directory to which Dump is Copied on Boot
[Entry Fields]
* DIRECTORY full pathname [] /
CONTINUE Boot if Copy Fails no
! You must give the directory full path name, and the directory must be in the root volume group. The default is the /var/adm/ras directory.
! If set to true and the dump cannot be copied, the boot will continue without copying the dump off the paging space. The default is no.
!Boot phase 2
The /var file system is verified using the fsck -f command and then
mounted. The copycore command checks if a dump occurred. If it did, it is
copied from default dump devices, /dev/hd6, to the default copy directory,
/var/adm/ras. Afterwards, /var is unmounted
在启动过程init进程调用rc.boot 2阶段,假如有dump发生,就从hd6拷贝到/var;
CONTINUE Boot if Copy Fails 的设定是针对这里的,设置为yes时,假如从hd6拷贝到/var的操作fail,boot也会继续;那如果设置为no,会停在那里等你决定是否转存到其他可移动介质上,或者取消转存继续引导过程。
另:如果dump设备不是hd6,也没有影响。
注:在AIX 系统中的lg_dumplv 逻辑卷是用于存放系统dump 的区域。 在安装系统时是否创建该逻辑卷与服务器的内存配置有关。 若服务器的内存小于4GB时, 那么在安装 AIX 5.2 或 5.3时,系统就不会自动创建它。而缺省将系统dump 存放在hd6上。
当服务器的内存大于4GB时,在安装AIX时,就会为系统 dump 创建一专用区域,该逻辑卷名就是 lg_dumplv. 其缺省大小是按以下规则分配的:
. 4GB < = 服务器的内存 〈 12GB lg_dump 的大小为 1GB
. 12GB < = 服务器的内存 〈 24GB lg_dump 的大小为 2GB
. 24GB < = 服务器的内存 〈 48GB lg_dump 的大小为 3GB
. 48GB < = 服务器的内存 lg_dump 的大小为 4GB
提示:
因为CONTINUE Boot if Copy Fails默认设置为no,对于dumpcheck检测到/var/adm/ras空间不够的机子,假如发生dump,机子在启动时会停下,等你决定是否转存到其他可移动介质上,或者取消转存继续引导过程。这在ATC服务器的日常维护中需要额外重视,这是机子不正常启动的原因之一!
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/7970627/viewspace-691818/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/7970627/viewspace-691818/