FusionServer uMate 简单上手指南

一、功能特性
  • uMate是一款用于华为服务器验收、开局以及维护场景的工具,支持华为机架服务器、刀片服务器、高密服务器等诸多产品型号,支持图形化界面和命令行界面,提供巡检、日志收集、固件升级、配置BIOS/BMC/HMM/RAID等功能,并且所有的功能都支持批量操作。 - 巡检功能的并行数量最少为1最多为20,其默认值是根据执行巡检的PC机的CPU总核数减1(避免巡检占用CPU过高)自动确定,例如,若执行巡检的PC机的CPU为4核,则巡检功能的并行数量为3;其他功能的并行数量可设置为1~50,默认为20;并行数量的设置方法请参考配置uMate。

注意点:

  • 配置BIOS的时候注意开启性能模式,并且把启动顺序设定为:HardWare——CD-ROM——PXE的顺序

  • 在raid卡的配置过程中有两个注意点。首先是阵列卡的型号需要匹配,注意修改配置文件。其次是磁盘的详细设置(slot)需要和物理盘一一对应。不然会导致 execute BIOS config failed。


二、图形化程序基本功能讲解
  • 因为官方提供的文档过于详细复杂,其实在日常使用过程中查阅效率麻烦,所以我会在这个章节中重点讲一下平时用的到的重要内容。
  • uMate官方提供了windows和linux两个版本的软件,同时两个版本下都有图形化界面和命令行cli界面提供。本章中我们主要围绕图形化windows程序进行讨论。

是一个没有美工的程序界面

下面来介绍一下界面里的相关功能。

编号名称
A设备检查
B日志收集
C升级评估
DIP配置
E配置检查
1BIOS配置
2BMC配置
3HMM配置
4RAID卡配置
5网络框架升级
6E9000升级
7挂载虚拟媒介
8-1电源控制
8-2BIOS导出
9内建测试
三、具体功能讲解
  • 本章中会主要讲一下【BIOS配置】和【RAID卡配置】,后续其他内容之后补充。这两个配置是平时在批量配置机器的时候最常用到的功能。在配置完这些之后可以使用ansible-playbook来进行批量配置。
0.首先介绍几乎所有功能都要用到的一个流程,就是服务器导入。点击任何一个功能,可以看到服务器导入的界面。

这个界面支持批量导入,但是前提是机器都已经初始化并设置好IBMCIP,并且是连续的,类似于都在172.16.0.0/27这种的。

然后在start IP和End IP输入起始和结束的IP,并输入BMC用户名和密码,点击Add加入整个段的机器。之后Next就会开始自动读取机器。

在之后的操作中,有些危险操作可能需要操作者输入yes后再操作,这个时候务必确认自己的操作没有错误。

1.BIOS配置
  • BIOS这东西不同型号的机器提供的功能完全不一样,但是整体的暴露功能还是雷同的,因此这一节也会大致进行讲解相关的内容。在BIOS设置的过程中需要额外小心,因为很多设置都会导致机器无法正常运行。下面主要来介绍几个主要的配置选项。

①BootMenu

Boot Type:启动模式,主要是UEFI和Lagacy PXE Boot to LAN:是否使用LAN运行PXE‘ First(Second/Third/Fourth) Boot Device:启动设备顺序,一般Hard Disk Drive第一个,CD-ROM第二个,PXE第三,USB第四 PXE Boot Capability:是否允许PXE启动

②AdvacedMenu

PXE1(2/3/4) Configuration:PXE在1/2/3/4网口是否启动检测

③SocketConfiguration

Power Policy:服务器启动策略,一般建议选择性能Performance Active Processor Cores:启用的cpu核心数 Hardware Prefetcher:是否硬件预载

2.RAID卡配置
  • Raid卡主要用来装有raid卡的机器读出磁盘并进行相关的管理,在uMate套件中,一般通过载入FusionServer Tools-Kit套件的iso文件和自定义的配置文件来进行写入。配置文件如下所示:

  • 配置文件的位置在程序根目录下./template/RAIDConfig文件夹下面,已经有基本完善的预设设定。

    <?xml version="1.0" encoding="UTF-8"?>
-<Profile version="V1">
        <!--RAID controller 1-->
    -<RAID>
            <!--Support RAID controller type:LSI2208\LSI2308\LSI3008\LSI3108\AvagoSAS3408\AvagoSAS3508-->
        <AdapterType>AvagoSAS3408</AdapterType>
        <ForceCfg>Enabled</ForceCfg>
            <!--RAID Array 1-->
        -<RAIDArray>
            <RAIDType>1</RAIDType>
            -<DiskArray>
                <Disk>0</Disk>
                <Disk>1</Disk>
            </DiskArray>
            -<LUN>
                <LUNSize>MAXSIZE</LUNSize>
            </LUN>
            -<DedicateHSP>
                <Disk>NA</Disk>
            </DedicateHSP>
            <WritePolicy>WriteBack</WritePolicy>
                <!--ReadAhead,ReadAheadNone -->
            <ReadPolicy>ReadAhead</ReadPolicy>
            <CachePolicy>Direct</CachePolicy>
            </RAIDArray>
            <!--RAID Array 2-->
        -<RAIDArray>
            <RAIDType>0</RAIDType>
            -<DiskArray>
                <Disk>2</Disk>
            </DiskArray>
            -<LUN>
                <LUNSize>MAXSIZE</LUNSize>
            </LUN>
            -<DedicateHSP>
                <Disk>NA</Disk>
            </DedicateHSP>
            <WritePolicy>WriteThrough</WritePolicy>
                <!--ReadAhead,ReadAheadNone -->
            <ReadPolicy>ReadAhead</ReadPolicy>
            <CachePolicy>Direct</CachePolicy>
        </RAIDArray>
        -<GlobalHSP>
            <Disk>NA</Disk>
        </GlobalHSP>
        <BootDrive>0</BootDrive>
    </RAID>
        <!--RAID controller 2-->
</Profile>
复制代码

这个配置文件中最重要的结构部分是这个结构。这个结构解释如下:

配置项功能
Raid卡型号。请按照默认提示+机器实际来
阵列卡raid type,例如RAID0,RAID10之类的
最小块大小,默认MAX就行了。
写入策略,默认WriteThrough。如果是RAID0要WriteBack
Cache策略,默认Direct即可。

在配置完ini配置文件之后,就可以开始进行配置应用了,一般等待十分钟左右即可完成。

3.电源控制
  • 在导入机器列表之后,可以看到电源操作选项,分别为PowerReset,PowerOn,PowerOff等等。根据自身的需求来操作即可。

转载于:https://juejin.im/post/5c8099fb6fb9a049ac79f0cc

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
华为服务器日常维护和故障处理介绍 目录 1.服务器日常维护 1.1 维护准备 1.2 日常巡检 1.3 软件升级 2.服务器故障处理 2.1 故障诊断流程 2.2 故障信息收集方法 2.3 故障定位方法 2.4 部件更换流程及注意事项 1.1 维护准备-硬件工具 服务器日常维护硬件工具一览表(按需提前准备)。 名称 说明 浮动螺母安装条 用于牵引浮动螺母,使浮动螺母安装在机柜的固定导槽孔位上。 螺丝刀 用于拆装螺钉,一般为一字、十字、六棱套筒等。 斜口钳 用于剪切绝缘套管、电缆扎线扣等。 万用表 用于测量电阻、电压,检查导通关系等。 防静电腕带 用于接触或操作设备和器件,可防止静电放电。 防静电手套 用于插拔单板、手拿单板或其他精密仪器等,可防止静电放电。 线扣 用于绑扎线缆。 梯子 用于高处作业。 便携机 自备网线,用于通过网络访问管理网口或业务网口,捕获数据。 串口线 服务器侧串口接口一般为DB9或RJ45。 温度计/湿度计 用于监控机房温度、湿度是否满足设备稳定运行环境。 1.1 维护准备-软件工具 服务器日常维护软件工具一览表(按需提前准备) 名称 说明 Putty/Winscp 开源工具,用于Windows客户端命令行方式访问Linux系统以及文件传输。 Toolkit Tools 主要功能:获取硬件信息;快速诊断;CPU、硬盘、内存的专项测试;硬盘擦除; 提供配置和部署常用的参考工具和脚本;制作可启动U盘,方便使用U盘运维; 针对渠道的自动配置诊断功能。 Umate Tools 提供巡检、日志收集、固件升级、配置BIOS/BMC/HMM/RAID等功能,并且所有 的功能都支持批量操作。 Winrar 第三方软件,需自备,用于压缩文件或解压。 Office 第三方软件,需自备,用于编辑Word、Excel等文档。 FwUpgrade 升级硬盘、网卡和RAID控制卡的固件。 InfoCollect 用于Linux/Windows日志收集,服务器日志收集工具,支撑维护问题定位。 1.1 维护准备-必读资料 服务器日常维护前必读资料如下表 名称 说明 资料获取 《用户指》 各型号服务器的用户指,介绍服务器产 品的结构、规格和安装。 资料获取方式: 《维护指》 各型号服务器的维护指,介绍服务器产 品的结构、规格和安装。 《告警参考》 各型号服务器的告警参考,介绍 iMana/iBMC/MM所支持服务器产品各类 型告警信息及处理建议。 《机房规范》 客户机房日常维护规范,现场维护时必须 严格遵守客户机房管理规范。 以实际客户机房规范为准。 目录 1.服务器日常维护 1.1 维护准备 1.2 日常巡检 1.3 软件升级 2.服务器故障处理 2.1 故障诊断流程 2.2 故障信息收集方法 2.3 故障定位方法 2.4 部件更换流程及注意事项 1.2 日常巡检-意义 服务器日常维护巡检目的如下: 及时发现并消除设备运行过程中可能存在的缺陷或隐患,并采取适当的措施 予以恢复和处理,维持设备的健康水平,降低设备的故障率。 实时掌握设备和网络的运行状况,了解设备和网络的运行趋势,提高维护人 员对突发事件的处理效率。 通过定期维护和保养设备,使设备的健康水平长期处于良好状态,确保系统 能够安全、稳定、可靠的运行。 通过定期检查、备份、测试、清洁等手段,及时发现设备在运行过程中出现 的自然老化、功能失效、性能下降等缺陷,并采取适当的措施及时予以处理, 以消除隐患,预防事故的发生。 1.2 日常巡检-基本原则 采用唯一的标识或名称 创建问题解决记录日志 一次只做一个改动,并记录结果 使用华为提供的工具、资源、软件 清楚操作系统和应用软件的更新 制定可靠的备份计划 现场保留备件,故障时及时更换 保存最新网络拓扑图方便解决问题 1.2 日常巡检-现场巡检 现场巡检包含机房环境和设备运行状态两方面。 机房环境巡检常见安全标识参考下表。 图标 说明 提示危险用电器件。请注意防止电击危险。请勿打开此器件。 警告:所有带有此标识的器件都存在电击危险,被标识区域没有可维护的器件! 提示危险器件。该器件可能造成电击危险。被标识区域没有可维护器件,请勿打开此器件。 警告:请注意防止电击危险,请勿打开此器件! 提示高温表面。 警告:小心烫伤,请等器件降温后再接触! 提示危险用电器件。该标识表示误操作可能会导致设备损坏或人身伤害。 该标识是设备外部的接地标识。接地电缆的两端分别接在不同设备上,表示设备必须通过接地点接地, 保证设备正常运行及操作人员的人身安全。 该标识是设备内部的接地标识。接地电缆的两端都接在同一个设备上的不同组件上,表示设备必须通 过接地点接地,保证设备正常运行及操作人员的人身安全。 该标识表示为静电敏感区,请勿徒手触摸设备。在该区域操作
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值