AIX系统errpt详解

在AIX中,errpt用于报告系统软硬件相关的错误日志信息

先来看一个实际的输出,不带参数简单列出所有的错误

#errpt
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
A2205861 1214144307 P S SYSPROC Excessive interrupt disablement time
F3931284 1213234807 I H ent1 ETHERNET NETWORK RECOVERY MODE
EC0BCCD4 1213234807 T H ent1 ETHERNET DOWN
F3931284 1213234807 I H ent1 ETHERNET NETWORK RECOVERY MODE
EC0BCCD4 1213233607 T H ent1 ETHERNET DOWN
0873CF9F 1212141207 T S pts/1 TTYHOG OVER-RUN
0873CF9F 1212141207 T S pts/1 TTYHOG OVER-RUN


使用-a参数查看详细信息

#errpt -a | more
—————————————————————————
LABEL: GOENT_RCVRY_EXIT
IDENTIFIER: F3931284

Date/Time: Thu Dec 13 23:48:47 BEIST 2007
Sequence Number: 162
Machine Id: 00099476D600
Node Id: db158
Class: H
Type: INFO
Re

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
LIMS系统 服务器运维管理手册 2016-10-24 一、 文档简介 2 二、 文档目的 3 三、 文档范围 3 四、 事件处理流程 3 五、 具体操作说明 4 1) 服务器硬件管理 4 2) 服务器系统管理 8 1. Windows系统管理 8 文档简介 本文档根据cc服务器硬件设备与系统应用管理需求,针对日常维护内容进行技术归类 于总结,描述具体操作步骤与操作方法,积累服务器事件处理能力,使之服务运维能力 更为主动可控。 文档目的 标准服务器故障处理方法指引,服务器管理知识库积累。 文档范围 服务器硬件故障判断与标准处理操作 服务器系统日常性能检测与标准检测 事件处理流程 具体操作说明 服务器硬件管理 1. 检查与故障判断: 服务器硬件的主动检查方式主要分三种: 设备面板指示灯检查 硬件系统日志检查 第三方工具检查 1) 面板指示灯检查 IBM服务器上面有,电源指示灯,硬盘/IDE设备活动指示灯,网卡指示灯,系统过热报 警灯.硬盘槽还有硬盘指示灯。HP服务器上面指示灯一般为UID,内部和外部健康灯 ,其他就是电源网口灯了,DELL的机种有的上面有风扇,内存,CPU,指示灯情况 ,图标都是很直观的,其它服务器与IBM,HP的差不多。 图示说明 详细描述: 2) 系统日志检查 "检查内容 " "硬件历史异常报错信息 " "计算机管理->系统工具->事件查看器,查看系统日志 " "重点关注:红色高危事件信息、日常频繁硬件报错信息 " "备注:查看硬件历史异常故障情况,分析硬件性能与使用生命周期 " 3) 第三方检测工具检查 "检查内容 " "硬件历史异常报错信息 " "HP 诊断工具: " "打开开始——程序——HP System Tools——HP Insight Diagnostics online " "Edition for Windows——HP Insight Diagnostics online Edition for " "Windows。 " "DELL诊断工具: " "第三方硬件设备诊断工具 " "IBM诊断工具: " "IBM Systems Director 、 IBM Systems Director Active Energy " "Manager、IBM ServerGuide " 相关图解: 进入诊断网页,在第一选项卡Survey中,上部有2个下拉项,左侧选择Advanced,右侧选 择All,会显示出更多硬件信息,点击右下的Save按钮保存。 此界面可以看到服务器所有硬件信息。 2. 硬件设备变更操作标准: 判断并确定最快恢复时间 判断是否有做冗余设置 判断是否需要关机操作 磁盘设备检测并确定阵列信息,确定有做数据备份 是否对其它关联应用有影响 制定回退方案,保证数据与应用的可用性 设备变更操作 设备兼容性测试 应用系统运行测试 设备变更后正式应用 服务器系统管理 服务器系统管理为: AIX系统管理 AIX系统管理 1. 磁盘空间使用 df -g命令 磁盘空间使用率是否已经到达80% 2. 进程监控、CPU性能、磁盘读写率 topas命令 查看进程的CPU使用率和磁盘读写率是否超阀值 3. 内存性能 vmstat 命令 查看内存最高峰值与一般使用率是否超阀值 4. 网络查看 netstat -an"grep tcp 检查是否能正常访问站点页面 5. 日志 记录错误报警信息 ——应用程序日志 由应用程序或者系统程序记录的事件 ——安全性日志 查看有效和无效的登录尝试事件,以及资源使用相关的事件 ——系统日志 AIX系统日志: errpt"more命令 最近系统中没有出现错误。 ----------------------- 简单操作-服务器运维手册全文共12页,当前为第1页。 简单操作-服务器运维手册全文共12页,当前为第2页。 简单操作-服务器运维手册全文共12页,当前为第3页。 简单操作-服务器运维手册全文共12页,当前为第4页。 简单操作-服务器运维手册全文共12页,当前为第5页。 简单操作-服务器运维手册全文共12页,当前为第6页。 简单操作-服务器运维手册全文共12页,当前为第7页。 简单操作-服务器运维手册全文共12页,当前为第8页。 简单操作-服务器运维手册全文共12页,当前为第9页。 简单操作-服务器运维手册全文共12页,当前为第10页。 内存使用率是否超过70%或者其他定义阀值 简单操作-服务器运维手册全文共12页,当前为第11页。 简单操作-服务器运维手册全文共12页,当前为第12页。
服务器容量管理程序 1 目的 为规范管理银行信息核心业务服务器容量,确保所有业务都拥有所需的系统性能。 2 范围 本程序适用于银行信息核心业务服务器及其他项目服务器的容量管理。 3 相关文件 《设备维护管理程序》 4 职责 4.1 中心机房管理员负责中心机房各系统容量的监控、维护与管理。 4.2 中心机房负责人负责对各记录的审批及对关键事务的决策。 4.3 其他人员配合中心机房管理员的工作。 5 程序 5.1 系统容量使用策略 5.1.1 正在进行的项目及核心业务,由中心机房管理员对其容量需求进行识别,识别完成后提 交《采购申请》给相应负责人审批,审批通过后由中心机房管理员根据需求对服务器进行 调整,以确保满足现有或新增的项目所需系统性能。 5.1.2 中心机房管理员应定期使用管理信息系统的工具,识别出系统容量使用趋势,预测未来 将要使用的系统资源,避免潜在的瓶颈及对关键人员的依赖,预防可能引起系统安全或 用户服务的威胁。 5.1.3 如新增项目或压力测试时应做假设分析,由项目组及相关负责人指定的小组来进行,主 要分析:利用率分析、事务分析、瓶颈分析、成本分析、分析完成后由相关项目负责人 确认,是否满足需求,如果不满足优化假设分析,直到相关负责人确认满足需求,最后 形成《采购申请》经过相关负责人审批后对容量进行规划或购买设备。 5.2 系统容量监控策略 5.2.1 系统使用容量应由中心机房管理员定期检查(每天)并形成各系统的检查记录,信息应 根据实际情况每季度对检查监控策略进行更新。 具体检查参数如下表:《应用系统检查报告》 "系统名称 "检查指标 "说明及检查时间 "检查目 "具体参数 " " " " "录 " " "核心业务系 "操作系统文件系 "14:00"文件系统使用率要求在"P570A "查看%Used项是否超 " "统 "统空间(/home/f" "80%以内属于正常范围 " "过80%,如果空间超 " " "xsh): " " " "过80%警戒,通知。 " " "操作系统文件系 "14:00"文件系统使用率要求在"P570A "查看%Used项是否超 " " "统空间(/backup)" "75%以内属于正常范围 " "过75%,如果空间超 " " ": " " " "过75%警戒,通知。 " " "数据库表空间: "14:00"select a.a1 "P570A "查看CCBS_TB表空间 " " " " "表空间名称,c.c2 " "大小(表空间-已使 " " " " "类型,c.c3 " "用空间)是否低于5G" " " " "区管理,b.b2/1024/102" "B,查看HIS11、HIS1" " " " "4 " "2表空间是否低于1GB" " " " "表空间大小M,(b.b2-a." ",查看UNDOTDBS1空 " " " " "a2)/1024/1024 " "间是否低于500M,如" " " " "已使用M,substr((b.b2" "果上述空间不足,通" " " " "-a.a2)/b.b2*100,1,5)" "知 " " " " "利用率 from (select " " " " " " "tablespace_name a1, " " " " " " "sum(nvl(bytes,0)) a2" " " " " " "from dba_free_space " " " " " " "group by " " " " " " "tablespace_name) " " " " " " "a,(select " " " " " " "tablespace_name " " " " " " "b1,sum(bytes) b2 " " " " " " "from dba_data_files " " " " " " "group by " " " " " " "tablespace_name) " " " " " " "b,(select " " " " " " "tablespace_name " " " " " " "c1,contents " " " " " " "c2,extent_management" " " " " " "c3 from " " " " " " "dba_tablespaces) c " " " " " " "where a.a1=b.b1 and " " " " " " "c.c1=b.b1; " " " " "操作系统和数据 "14:20"用errpt命令检查 "P5707A "查看错误列表,如果" " "库是否有错误: " " " "存在通知。 " "渠道系统 "操作系统文件系 "14:20"关键的文件系统使用率"P570B "查看%Used项是否超
第一章 AIX操作系统简介 8 1.1 AIX操作系统的主要特点 8 1.1.1 遵循众多工业标准 8 1.1.2 先进的系统设计 8 1.1.3 强大的通讯能力 9 1.1.4 终端支持 9 1.2 AIX系统架构 9 1.3 命令语言解释器(KSH) 9 1.4 AIX文本编辑器 9 1.5 AIX系统中的DOS工具 9 1.6 AIX系统的用户界面 10 1.7 联机帮助 10 1.8 AIX的几个重要技术 11 1.8.1 LVM-Logical Volume Manager 11 1.8.2 JFS-Journal File System 11 1.8.3 系统管理接口工具(smit) 11 第二章 AIX操作系统的安装 14 1.1 安装介质与方式 14 1.2 安装步骤 14 1.2.1 准备工作 14 1.2.2 BOS(Base Operating System)安装 14 1.2.3 OPP(Optional Program Product)扩展子系统安装 17 1.3 系统启动过程 18 第三章 AIX操作系统基本命令 19 3.1 系统的进入和退出 19 3.2 PASSWORD 19 3.3 MKDIR、RM、MV和CD 19 3.4 LS 19 3.5 DATE 19 3.6 CAL 20 3.7 CAT 20 3.8 WC 20 3.9 CLEAR 、ECHO和BANNER 20 3.10 WHO 20 3.11 FINGER 20 3.12 MAIL 21 3.13 PS 21 3.14 KILL 21 3.15 FIND 22 3.16 GREP 22 3.17 CUT 23 3.18 SORT 23 3.19 HEAD 和TAIL 24 3.20 DOS工具 24 3.21 管道与重定向 24 3.22 LSDEV 25 3.23 LSPV 26 3.24 CFGMGR 27 3.25 LSATTR 27 3.26 ERRPT 28 第四章 VI编辑器 29 4.1 VI 简介 29 4.2 VI的进入与离开 29 4.3 VI 的文本输入模式 29 4.4 VI 基本编辑命令 30 4.5 文件处理子命令 31 第五章 对象数据管理 33 第六章 存储管理 34 6.1 相关术语 34 6.1.1 PV (Physical Volume) 34 6.1.2 VG (Volume Group) 34 6.1.3 PP (Physical Partition) 34 6.1.4 LP (Logical Partition) 35 6.1.5 LV(Logical Volume) 35 6.1.6 Mirror(镜像) 35 6.1.7 VGDA(Volume Group Description Area,卷组描述区) 35 6.1.8 VGSA(Volume Group Status Area,卷组状态区) 35 6.2 PV的管理 36 6.2.1 配置一个PV 36 6.2.2 修改PV的属性 36 6.2.3 删除一个PV 36 6.3 VG的管理 36 6.3.1 创建一个VG 36 6.3.2 删除一个VG 37 6.3.3 对VG的管理 37 6.4 LV的管理 38 6.4.1 增加一个LV 38 6.4.2 修改LV的属性 38 6.4.3 删除一个LV 39 第七章 文件系统 40 7.1 概述 40 7.2 日志文件系统 40 7.2.1 增加文件系统 41 7.2.2 在一个已有的LV上建立文件系统 41 7.2.3 修改文件系统的属性 42 7.2.4 mount /umount 一个文件系统 42 7.2.5 改变文件系统的大小 43 7.2.6 文件系统的删除 44 7.2.7 JFS log 设备 44 第八章 页面交换空间-PAGING SPACE 45 8.1 查看PAGING SPACE的状态 45 8.2 增加一个PAGING SPACE 46 8.3 修改PAGING SPACE的属性 46 8.4 删除一个PAGING SPACE 47 第九章 系统资源控制器的管理 48 9.1 启动SRC 48 9.2 STARTSRC命令 48 9.3 REFRESH命令 49 9.4 CRON后台进程 49 9.4.1 at 50 9.4.2 batch 50 第十章 系统性能调整 51 10.1 VMSTAT 51 10.2 IOSTAT 52 10.3 NETSTAT 52 第十一章 用户管理 55 11.1 与用户管理相关的重要系统文件 55 11.1.1 /etc/passwd 55 11.1.2 /etc/security/passwd 55 11.1.3 /usr/lib/security/mkuser.default 55 11.1.4 /etc/group 55 11.1.5 /etc/security/group 55 11.1.6 /etc/environment 55 11.1.7 /etc/security/environment 55 11.1.8 /etc/utmp , /var/adm/wtmp , /etc/security/failedlogin 56 11.1.9 /etc/motd 56 11.1.10 /etc/security/user 56 11.1.11 /etc/security/limits 56 11.1.12 /etc/security/login.cfg 56 11.2 用户组管理 56 11.2.1 增加一个用户组 56 11.2.2 修改一个用户组 56 11.2.3 删除一个用户组 57 11.3 用户管理 57 11.3.1 增加一个用户 57 11.3.2 修改用户参数 57 11.3.3 删除一个用户 57 11.3.4 显示用户信息 57 11.4 COMMON DESKTOP ENVIRONMENT 58 11.4.1 Enabling and Disabling Desktop Autostart 58 11.4.2 手工启动CDE 58 11.4.3 手工停止CDE 58 第十二章 打印管理 59 12.1 创建一个打印队列 60 12.2 打印配置文件 60 12.3 打印队列的控制 61 12.4 启动和停止一个打印队列 61 第十三章 网络配置 63 13.1 TCP/IP通讯后台进程 63 13.2 以太网的配置 63 13.2.1 增加一个以太网卡 64 13.2.2 修改以太网卡接口 64 13.2.3 删除一个以太网卡 64 13.2.4 TCP/IP的测试 64 13.3 /ETC/HOSTS文件 64 13.4 UNAME 命令 64 第十四章 系统的备份与恢复 65 14.1 MKSYSB命令 66 14.2 系统备份 66 14.3 其他备份工具 67 第十五章 AIX操作系统命令小结 68 15.1 逻辑卷管理命令总结 68 15.1.1 物理卷命令 68 15.1.2 卷组命令 68 15.1.3 逻辑卷命令 68 15.1.4 文件系统命令 69 15.2 交换空间管理 69 15.3 用户管理 69 15.4 其他 69 第十六章 光盘库(3995 C系列)及ADSM的安装、调试和使用 70 第十七章 SNA子系统介绍 76 17.1 SNA介绍 76 17.2 SNA的配置 76 17.3 SNA的编程 87 第十八章 基于UNIX编程技巧介绍 118 18.1 进程控制 118 18.1.1 进程的建立与运行 118 18.1.2 进程的控制操作 120 18.1.3 进程的属性 120 18.2 进程的通讯 123 18.2.1 引言 123 18.2.2 信号通信机构 124 18.2.3 管道通信机构 135 18.2.4 FIFO通信机构 144 18.2.5 记录锁定 147 18.2.6 IPC通信机构 153 第二十章 关系数据库(INFORMIX)的管理技巧 172
AIX常用命令://查看机器序列号,IBM的基本信息都可以通过该命令查询得到 #prtconf #oslevel -r == uname -a //操作系统版本 #oslevel //查看操作系统版本ex :5.1.0.0 #oslevel -r //ex:5100-04 == oslevel -q //双机软件版本号 # lslpp -l|grep cluster //显示graphic display # lsdisp //查看CPU的个数 # bindprocessor -q //查看CPU的主频,操作系统版本最低是AIX 5.1,包含在软件包bos.pmapi.pmsvcs pmcycles This machine runs at 1500MHz //显示cpu的主频是1.5G #如何查找根文件系统(/)中的大文件 find -xdev -size +xxxx -ls #查找根卷组下大于2M的文件, 并根据文件大小排序, 大文件在前. find / -xdev -size +1024 -ls |sort -r +6 8277 624 -r-xr-xr-x 1 root system 635390 Jul 31 2003 /sbin/helpers/jfs2/fsck 28 596 -rw-r--r-- 1 root system 609388 Apr 12 17:25 /smit.log 30 1660 -rw-r--r-- 1 root system 3338083 Apr 5 14:08 /core #查看备份磁带中备份文件的大小 tcopy /dev/rmt0 tcopy: Tape File: 1; Records: 1 to 251; Size: 2097152. ---磁带机文件头大小 tcopy: Tape File: 1; Record: 252; Size 344064. ---磁带机文件头大小 tcopy: File: 1; End of File after: 252 Records, 526729216 Bytes. ---文件大小 tcopy: The end of the tape is reached. tcopy: The total tape length is 526729216 bytes. #如何取定文件与文件集的对应关系,有时想使用某个安装文件, 但没有安装包含该文件的文件集,找到文件集来安装所需文件 首先确认系统中已经安装了“bos.content_list”文件集(fileset), 如果没有安装, 请使用smitty installp进行安装. 运行which_fileset命令, 根据文件查找对应的文件集. 例如: #which_fileset iostat /usr/bin/iostat bos.acct 5.1.0.0 运行lslpp -f 命令, 查看指定文件集中包含的文件: #lslpp -f bos.acct //出于AIX系统安全考虑, 需要使某些用户只能在控制台登录使用,而不允许远程登陆使用. 更改/etc/security/user 文件中需要限制的用户的rlogin属性(rlogin = false) 当再次尝试远程登录时, 系统报错:Remote logins are not allowed for this account, 表示修改成功 //如何自动logout用户 有的用户登录后就长时间空闲,有可能导致安全上的问题,通过打开 /etc/profile 中 TMOUT 注释,将在设置的时间到达后自动logout用户 例如: export TMOUT=120 那么, 用户两分钟没有击键,将自动logout //AIX系统中如何限制用户所使用文件的大小(AIX小型机有大文件限制) >#smit chuser 在菜单上选择要控制的用户, 并修改下面两项: Soft FILE size [aaa] Hard FILE size [aaa] 则修改后用户的文件大小最大为aaa×512 bytes. >如何验证? 可以用该用户登录系统, 使用命令“ulimit -f”和“ulimit -Hf”可分别显示其fsize,fsize_hard的大

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值