E87EF1BEThelargestdumpdeviceistoosmall

6D87B1C0Thedumpdevicecannotbeaccessed

为了增强故障分析能力,IBM的服务器增加了对设备故障当前环境的保存功能,就是保存一份设备故障时的内存、CPU寄存器、IO等设备的数据和状态信息,如果系统并没有停住,只是某个程序死掉,会产生COREDUMP,在当前目录下产生一个CORE文件。而如果操作系统死掉,则产生SystemDUMP或者SystemCrash,通常会引起系统停机。DUMP的记录如下图所示。

当系统进行DUMP时,DUMP管理设施自动将内核相关的数据(kernelsegment0及其他由内核或者内核扩展程序记录在主DUMP表中的内存块)复制到主DUMP设备。可以把DUMP理解为系统当时的一个快照,供以后分析

系统dump一般可以通过升级微码、提高系统补丁级别、升级驱动等方式解决。

参考http://www.myexception.cn/ai/439743.htmlAIX的Dump资料学习笔记(原创)

用sysdumpdev -l 查看一下系统dump的设置。AIX的dump一般会分为主dump设备和次dump设备,设备可自主定义到自建的LV,如果内存大于4GB,缺省的dump设备是/dev/lg_dumplv,该设备是专门为dump而设置的。

注:AIX系统中的lg_dumplv逻辑卷是用于存放系统dump的区域。在安装系统时是否创建该逻辑卷与服务器的内存配置有关。若服务器的内存小于4GB,那么在安装AIX5.25.3时,系统就不会自动创建它。而缺省将系统dump存放在hd6上。
当服务器的内存大于4GB时,在安装AIX时,就会为系统dump创建一专用区域,该逻辑卷名就是lg_dumplv.其缺省大小是按以下规则分配的:
.4GB<=服务器的内存〈12GBlg_dump的大小为1GB
.12GB<=服务器的内存〈24GBlg_dump的大小为2GB
.24GB<=服务器的内存〈48GBlg_dump的大小为3GB
.48GB<=服务器的内存lg_dump的大小为4GB

ERRPT:6D87B1C0Thedumpdevicecannotbeaccessed

#sysdumpdev-l
primary-
secondary/dev/sysdumpnull
copydirectory/var/adm/ras
forcedcopyflagTRUE
alwaysallowdumpTRUE
dumpcompressionON
typeofdumptraditional

可以看出是主转储设备未设置。解决方法:

1.smitlv:创建一个lg_dumplv,设备类型为sysdump,6个pps约3G

2.sysdumpdev-P-p/dev/lg_dumplv:设置主转储设备

3.#/usr/lib/ras/dumpcheck

4.#errpt,发现不再提示无法访问但提示太小。如下:

ERRPT:E87EF1BEThelargestdumpdeviceistoosmall

解决方法:

1.查看lg_dumplv大小的估计值

#sysdumpdev-e
0453-041Estimateddumpsizeinbytes:3687651328

即3.6G

2.现在lg_dumplv大小

#lslvlg_dumplv

其中PPSIZE:512megabyte(s)

PPs:6

经计算,现在容量为13G.需要扩容0.2G

3.查看lg_dumplv所在的vg的容量是否够用

#lsvgrootvg

其中PPSIZE:512megabyte(s)

TOTALPPs:1092(279552megabytes)

FREEPPs:413(211456megabytes)

经计算,vg剩余容量为206.5G,因为根盘做了镜像.,可用剩余容量为103G左右.ppsize为512m,故扩容2pps,即1G(其实扩1pp也可以.2个放心点.)

4.扩容操作

extendlvlg_dumplv2

5.检查当前lg_dumplv的大小.

#lslvlg_dumplv

其中PPSIZE:512megabyte(s)

PPs:8

,现在容量为4G.

6.使用dumpcheck命令查看,是否还出现errpt信息

#/usr/lib/ras/dumpcheck

#errpt

不出现,则为成功.

清空epprt信息命令为errclear0