系统服务器日常巡检文档,服务器设备日常巡检指导书.pdf

服务器设备日常巡检指导书

目录

1、声明3

2 、巡检工具清单3

3、机房环境及线缆布局巡检项目3

3.1、巡检注意事项3

3.2、服务器所在机房环境巡检4

3.3、服务器相关的线缆布局情况巡检4

4 、Tecal 服务器巡检5

4.1 、服务器指示灯巡检5

4.2 、服务器iMana 健康信息巡检5

4.3 、MM 管理模块健康信息巡检6

附录:服务器巡检清单6

1、声明

本指导书用于华为Tecal 服务器设备的日常维护巡检,操作前应征得客户同意。巡

检的操作应仅仅针对服务器外观以及系统的管理单元,如服务器的iMana 单元或者MM

管理模块等,不应对业务面有任何操作,以免意外中断客户重要业务。

现场工程师在操作前应仔细阅读相关服务器设备的用户指南(用户指南可在配套光

盘中获取到,或者通过登录/enterprise 进行下载),有任何

不清楚的地方务必确认清楚, 整个操作过程请做好静电防护和机器保护工作。

2、巡检工具清单

巡检所需要的工具清单如下表:

序号 工具名称 数量 说明

1 便携机 1 用于和 iMana/ MM 管理网口相连查询机器状

态。

2 网线 1 用于便携机和iMana/ MM 管理网口相连。

3 RJ45 接口串口线 1 备选

4 十字螺丝刀 1 备用

3、机房环境及线缆布局巡检项目

3.1、巡检注意事项

在巡检之前,为了避免潜在的危险,请先熟悉下表中所列的安全信息符号,下列符

号可能放置在服务器的一些部件上面。

图标 说明

提示危险用电器件。请注意防止电击危险。请勿打开此器件。

警告:所有带有此标识的器件都存在电击危险,被标识区域没有可维护的器

件!

提示危险器件。该器件可能造成电击危险。被标识区域没有可维护器件,请勿

打开此器件。

警告:请注意防止电击危险,请勿打开此器件!

提示高温表面。

警告:小心烫伤,请等器件降温后再接触!

提示危险用电器件。该标识表示误操作可能会导致设备损坏或人身伤害。

该标识是设备外部的接地标识。接地电缆的两端分别接在不同设备上,表示设

备必

须通过接地点接地,保证设备正常运行及操作人员的人身安全。

该标识是设备内部的接地标识。接地电缆的两端都接在同一个设备上的不同组

上,表示设备必须通过接地点接地,保证设备正常运行及操作人员的人身安

全。

该标识表示为静电敏感区,请勿徒手触摸设备。在该区域操作时,请采取严格

防静电措施,例如佩戴防静电腕带或者防静电手套。

3.2、服务器所在机房环境巡检

检查机房环境主要包括机房内部的空调、供电设备和策略等。

序号 技术指标项 结果 说明

1 工作温度 10℃~ 35℃(41℉~ 95℉)间正常

2. 存储温度 -40 ℃~+65℃(-40℉~ 149℉)

3 温度变化率 15℃/h (59℉/h )

4 工作湿度 8% RH ~ 90% RH (无冷凝)

5 存储湿度 5% RH ~ 95% RH (无冷凝)

6 工作海拔高度

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
第 1 页 共 18 页 联想服务器虚拟化 日常运维巡检方案 联想集团 Lenovo Co., Ltd. 2014 年 10 月 联想服务器虚拟化 – 日常运维巡检方案 联想企业级服务 第 2 页 共 18 页 文档编号 密级 商业机密 版本编号 V 0.1 日期 2014-10 联想服务器虚拟化 – 日常运维巡检方案 联想企业级服务 第 3 页 共 18 页 目 录 1. 引言........................................................................................................................ 4 1.1. 编写目的................................................................................................... 4 2. 运维巡检方案........................................................................................................ 4 2.1. VMware vSphere 整体架构 ................................................................. 4 2.2. 运维巡检服务........................................................................................... 6 2.2.1. VMWare 健康检查服务 ................................................................. 9 2.2.2. 分时间频率的巡检方案.................................................................. 11 3. 附录...................................................................................................................... 16 3.1. 联想公司简介......................................................................................... 16 联想服务器虚拟化 – 日常运维巡检方案 联想企业级服务 第 4 页 共 18 页 1. 引言 1.1. 编写目的 本手册基于 VMWare vSphere 服务器虚拟化系统日常维护的基础上完成,内容包 括虚拟化平台日常系统运行维护,健康检查使用说明,能够保持系统健康稳定的运行,本手 册适用读者为:系统安装人员、系统管理人员。 2. 运维巡检方案 2.1. VMware vSphere 整体架构 VMware vSphere 是目前最值得信赖的虚拟化平台,它的出现是 IT 计算领域具有变 革意义的一种进步。基于经验证的虚拟化平台构建,并以此作为私有云和公共云的基础,并 使用联邦与标准来桥接各个云计算基础架构, 从而创建一种可响应不断变化的业务需求的混 合型云结构。降低资金成本和运营成本并增强对 IT 基础架构的控制能力,同时保留选择任 意操作系统、应用程序和硬件的灵活性: 让 IT 员工将精力转移到打造具有变革意义的业务解决方案上, 而不是放在对硬件 和软件的例行维护上 更充分地利用现有 IT 资产,并使数据中心的资金开销最多降低 60% 大幅降低电力、散热和占地空间需求,并使资源成本降低多达 80% 联想服务器虚拟化 – 日常运维巡检方案 联想企业级服务 第 5 页 共 18 页 基础架构服务-虚拟化和聚合硬件资源 基础架构服务可全面虚拟化服务器、存储设备和网络资源,聚合这些资源,并基于业务 优先级将资源准确地按需分配给应用程序。 ESXi 5.5 是 VMware 虚拟架构套件的基础组成部分,是动态、自我优化的 IT 基础结 构的基础。VMware ESXi 将业界标准的 x86 服务器及其现有的处理器、内存、磁盘和网 络连接一起转换到一个逻辑计算资源池中。 操作系统及其应用程序则被隔离到安全、 可移动 的虚拟机中。VMware ESXi 是一个强健、经过生产验证的虚拟层,它直接安装在物理服务 器的裸机上,将物理服务器上的处理器、内存、存储器和网络资源抽象到多个虚拟机中。通
服务器设备日常巡检指导书 目 录 1、声明 3 2、巡检工具清单 3 3、机房环境及线缆布局巡检项目 3 3.1、巡检注意事项 3 3.2、服务器所在机房环境巡检 4 3.3、服务器相关的线缆布局情况巡检 4 4、Tecal 服务器巡检 5 4.1、服务器指示灯巡检 5 4.2、服务器iMana健康信息巡检 5 4.3、MM管理模块健康信息巡检 6 附录:服务器巡检清单 6 1、声明 本指导书用于华为Tecal服务器设备日常维护巡检,操作前应征得客户同意。巡检的操作应仅仅针对服务器外观以及系统的管理单元,如服务器的iMana单元或者MM管理模块等,不应对业务面有任何操作,以免意外中断客户重要业务。 现场工程师在操作前应仔细阅读相关服务器设备的用户指南(用户指南可在配套光盘中获取到,或者通过登录http://support.huawei.com/enterprise进行下载),有任何不清楚的地方务必确认清楚, 整个操作过程请做好静电防护和机器保护工作。 2、巡检工具清单 巡检所需要的工具清单如下表: 序号 工具名称 数量 说明 1 便携机 1 用于和iMana/MM管理网口相连查询机器状态。 2 网线 1 用于便携机和iMana/MM管理网口相连。 3 RJ45接口串口线 1 备选 4 十字螺丝刀 1 备用 3、机房环境及线缆布局巡检项目 3.1、巡检注意事项 在巡检之前,为了避免潜在的危险,请先熟悉下表中所列的安全信息符号,下列符号可能放置在服务器的一些部件上面。 图标 说明 提示危险用电器件。请注意防止电击危险。请勿打开此器件。 警告:所有带有此标识的器件都存在电击危险,被标识区域没有可维护的器件! 提示危险器件。该器件可能造成电击危险。被标识区域没有可维护器件,请勿打开此器件。 警告:请注意防止电击危险,请勿打开此器件! 提示高温表面。 警告:小心烫伤,请等器件降温后再接触! 提示危险用电器件。该标识表示误操作可能会导致设备损坏或人身伤害。 该标识是设备外部的接地标识。接地电缆的两端分别接在不同设备上,表示设备必 须通过接地点接地,保证设备正常运行及操作人员的人身安全。 该标识是设备内部的接地标识。接地电缆的两端都接在同一个设备上的不同组件 上,表示设备必须通过接地点接地,保证设备正常运行及操作人员的人身安全。 该标识表示为静电敏感区,请勿徒手触摸设备。在该区域操作时,请采取严格的 防静电措施,例如佩戴防静电腕带或者防静电手套。 3.2、服务器所在机房环境巡检 检查机房环境主要包括机房内部的空调、供电设备和 略等。 序号 技术指标项 结果 说明 1 工作温度 10 ~ 35 (41 ~ 95 )间正常 2. 存储温度 -40 ~+65 (-40 ~ 149 ) 3 温度变化率 15 /h(59 /h) 4 工作湿度 8% RH ~ 90% RH(无冷凝) 5 存储湿度 5% RH ~ 95% RH(无冷凝) 6 工作海拔高度 3000m 7 电源 交流供电:输入电压范围100V AC ~ 240V AC,50/60Hz 直流供电:标称-48VDC,电压波动范围–38.4V~–57.6V DC 机房环境检查表 3.3、服务器相关的线缆布局情况巡检 对线缆的巡检,建议肉眼查看即可,即使需要重新拔插,也得征得客户的同意。日常操作线缆时,为防止损坏,需注意以下事项: 检查电源线。 – 确保三线制电源接地线的接头表面良好。 –确保电源线的类型正确。 –确保电源线表面绝缘部分没有任何破损。 保证线缆远离热源;线缆避免紧绷,保持松弛。 插拔线缆时,不要用力过大。 尽可能通过连接端口插拔线缆。 任何情况下,禁止扭曲或者拉扯线缆。 合理布线,保证需要拆卸或者更换的部件不会接触线缆,确保所有电源线正确连接。 序号 检查内容 检查结果 备注 1 线缆总布放 强电、弱电线应该分别从机柜两边走线,即业务、电源线分离。特别注意光纤是否有被小角度弯曲或强行拉伸。 2 电源线布放 整齐、美观、有序,尽量与机房内其余机柜布线风格保持一致,电源线禁止挽圈。 3 业务线布放 整齐、美观、有序,尽量与机房内其余机柜布线风格保持一致。 4 地线连接 服务器设备要按规定接地。 5 线缆标签标注、粘贴 标签字体清晰,标注明确且含义准确,粘贴牢固。 6 电源线插头检查 检查服务器的电源线是否牢固插入电源插座。 7 信号线插头检查 检查服务器、交换机等设备之间的信号、数据线连接是否牢固。 线缆布局检查表 4、Tecal 服务器巡检 4.1、服务器指示灯巡检 Tecal 服务器前后面板分别提供UID按钮/指示灯、HEALTHY健康指示灯、网口指示灯、电源开关按钮指示灯等。通过观察指示灯状态可以初步诊断当前服务器的状态。指示灯状态说明参考服务器产品文档(产品文档可在配套光
Linux服务器巡检指导 "设备 " " "硬件配置信息 " "机型号 " " "CPU " " "内存 " " "硬盘 " " "系统信息 " "操作系统 " " "IP " " "主机名 " " (一)服务器硬件检查 "检查项 "检查操作 "参考标准 "巡检情况 " " " " " " "机柜或者机器上的 "观察机柜以及机器上的 "是否在防尘上堵塞导 " " "防尘网 "防尘网上的灰尘 "致气流不畅。 " " " " " " " "系统风扇运转检查 "观察并用手感觉进风和 "主机和磁盘柜的所有 " " " "出风是否正常 "风扇运转正常。 " " " " " " " "系统运装噪音检查 "仔细听系统运转声音 "噪音是否过大,有无 " " " " "异常声音 " " " " " " " "系统电源指示灯检 "观察液晶面板、电源指 "液晶面板、电源指示 " " "查 "示灯、硬盘报警灯等显 "灯、硬盘报警灯等显 " " " "示 "示情况正常 " " " " " " " " "服务器硬盘工作状 "硬盘指示灯指示是否正 "绿色闪烁 " " " "态 "常,一般绿色为正常 " " " " "检查网线是否连接 " " " " " "正常 "检查网线与交换机之间 "交换机连接主机的所 " " " " "的连线是否正常,以及 "有端口指示灯为长亮 " " " " "双机心跳网线连接是否 ",双机系统的公网与 " " " " "正常 "交换机之间的连接应 " " " " " "为交叉连接。 " " " " "服务器插上网线后,若 " " " " " "有数据传输,则网卡指 " " " " " "示灯呈现规律性闪烁; " " " " "服务器网卡工作状 "若闪烁不正常或指示灯 "网卡指示灯正常闪烁 " " " "态 "指示颜色不正常,则说 " " " " " "明系统数据传输将不正 " " " " " "常 " " " " " " " " " " "服务器散热检测 "靠近服务器检查是否有 " " " " " "热风吹出 " " " " " " " " " " "服务器电源连接检 "电源连接线是否有松动 " " " " "查 "、接触不良等情况 " " " " " " " " " " "服务器外壳整体检 "服务器整体是否有移动 " " " " "查 "或损害痕迹 " " " " "服务器机房温度 "机房的温度是否异常变 "参考值温度:20 -26 " " " " "动,温度数值多少 " " " " " " " " " " "服务器机房湿度 "机房的湿度是否异常变 "参考值温度:45%-60%" " " " "动,湿度计数值多少 " " " " " " " " " " "服务器机房静电防 "防静电地板是否损坏, " " " " "护 "防静电设备是否正常 " " " " " " " " " " "服务器标签检查 "标签是否松动、脱落, " " " " " "字体是否模糊不清 " " " " (二)操作系统检查 "检查项 "检查操作 "参考标准 "巡检情况 " "操作系统版本检查 "执行命令uname -a " " " " " " " " " " "系统账户检查 "利用root身份、口令登"能够正常登陆到系统 " " " "陆 " " " " " " " " "系统运行状态 "#uptime "系统UP时间应该为上次" " " " "重启到目前的时间 " " " " (二)性能检查 "检查项 "检查操作 "参考标准 "巡检情况 " "检查各进程资源CPU占用率 " "CPU使用率小于80% " " " "#top -c " " " "检查各进程资源内存占用率 " "内存使用率小于80% " " " "#top –c " " " "检查各进程资源内存交换区使" "内存交换区使用率小" " "用率 "#top –c "于80% " " " " " " " " "#top –c 进程名 "察看系统最占资源的" " "进出占用资源检查 " "进程 " " " " "察看具体某个进程占" " " " "用资源的具体情况 " " Top命令 统计信息区 前五行是系统整体的统计信息。第一行是任务队列信息,同 uptime 命令的执行结果。其内容如下: "16:35:22 "当前时间 " " up 17 day 5:45"系统运行时间,格式为时:分 " "4 user "当前登录用户数 " "load average: "系统负载,即任务队列的平均长度。 三个数值分别 " "0.15, 0.15, "为 1分钟、5分钟、15分钟前到现在的平均值。 " "0.08 " " "Tasks: 366 "进程总数 " "total " " "1 running "正在运

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值