ibm pureflex_IBM PureFlex System虚拟化配置可实现最佳功能

IBM PureFlex System是一个集成的基础设施解决方案,包含计算、存储、网络和管理。本文主要讨论如何验证和优化PureFlex System的虚拟化配置,如Flex System Manager、IBM Power计算节点和虚拟I/O服务器(VIOS)。通过检查基础架构组件的状态、版本和通信,确保PureFlex System达到最佳性能。此外,还涵盖了IBM Power系统的固件级别、主机和VIOS的验证过程,以确保环境稳定和高效。
摘要由CSDN通过智能技术生成

IBM PureFlex System是一个集成的基础架构解决方案。 PureFlex System将计算,存储,网络,虚拟化和管理结合到一个基础架构系统中。

IBM Flex System Manager是一种系统管理设备,可提高数据中心的效率并节省成本。 IBM Flex System Manager具有对服务器,存储和网络的全面的内置虚拟化支持,以加快配置并提高弹性。

由于错误或缺少虚拟化配置,Flex System Manager功能可能会失败。 诊断和修复环境和配置问题确实非常困难。 建议的教程涵盖以下资源的常见配置验证:

  • 基本配置(Base Flex System Manager服务器验证)
  • 虚拟化配置(IBM Flex System Manager VMControl™验证)
  • 其他配置(其他Advance Manager验证)
  • 主机和逻辑分区(LPAR)验证
  • 用于IBM Power Systems™验证的虚拟I / O服务器(VIOS)

本教程重点介绍PureFlex System支持的IBMPower®虚拟化环境的基本验证。

这些配置对于在虚拟环境中使用PureFlex System使其发挥最佳容量非常重要。 IBM PureFlex System支持以下体系结构:

  • 电力系统
  • 虚拟机
  • 的VMware

本教程可帮助使用Flex System Manager使用PureFlex System解决方案的任何人(包括客户,IBM独立软件供应商(ISV),开发和测试团队,基于实验室的服务(LBS)团队等)。

图1. Pure Flex系统
纯弹性系统

图1显示了可以具有多个机箱的机架。 每个机箱将具有多个计算节点和一个Flex System Manager。 机箱还将连接有存储和网络交换机。

图2.具有SAN存储和电源节点的Flex System Manager
具有SAN存储和Power节点的Flex System Manager

图2具有一个Flex System Manager作为管理实体,该实体将同时具有存储区域网络(SAN)存储和IBM Power服务器。 Power服务器将具有VIOS分区,该分区将装有Common Agent Services(CAS)和Common Repository Subagent。

启用基础架构

在PureFlex System环境中,应预先安装一些初始组件,其中包括:

  1. Flex系统管理员
  2. IBM Flex System Manager VMControl
  3. 其他高级插件,例如网络控制,存储控制等

验证启用基础结构需要某些步骤。

  1. Flex System Manager状态 :第一步也是重要的第一步是检查Flex System Manager服务器的状态。 它应该已启动并正在运行。 smstatus命令将检查Flex System Manager服务器的状态。

    清单1. smstatus命令输出

    USERID@c598n34:~> smstatus Active USERID@c598n34:~>

    纠正措施:

    • 非活动状态:运行smstart;smstatus –r命令以启动服务器并递归检查状态。
    • 错误状态:运行smstop –f;smstart;smstatus –r命令以强制停止服务器,启动服务器并递归检查状态。
  2. IBM Flex System Manager服务器版本 :检查用户是否安装了具有所需内部版本号的所需Flex System Manager服务器版本。

    清单2. Flex System Manager服务器版本输出

    USERID@c598n34:~> cat /opt/ibm/director/version.srv smcore.ver=6.3.4 smcore.level=usmi13c-0033 smcore.build=0001 smcore.build.date=9-23-2013 smprod.ver=6.3.4 smprod.level=usmi13c-0033 smprod.build=0001 smprod.build.date=9-23-2013 component=IBM Systems Director Server version=6.3.4 version.displayable=6.3.4 date=9-23-2013 level=usmi13c-0033 USERID@c598n34:~>

    纠正措施:

    如果找不到Flex System Manager服务器的版本,请检查网络连接并确保管理服务器的状态为活动。

  3. Flex System Manager版本:检查用户是否具有所需的Flex System Manager版本。

    清单3. Flex System Manager版本输出

    USERID@c598n34:~> lsconfig -V "version= Version: 1 Release: 3 Service Pack: 1 FSM Build level 20130923-1206 2013_266.Mon Sep 23 12:09:189 CDT 2013 ","base_version=V1R3 " USERID@c598n34:~>

    纠正措施:

    验证网络连接,并确保管理节点或设备的状态为活动。

  4. 服务器和OS MEP的Flex System Manager通信状态,访问状态和协议:检查Flex System Manager服务器和操作系统管理的端点(MEP)的通信状态,访问状态和协议是否处于良好状态。

    清单4.预期的Flex System Manager服务器和操作系统MEP状态

    USERID@c598n34:~> smcli lssys -i 10.32.73.34 -A AccessState,CommunicationState, Protocols c598n34.pokprv.stglabs.ibm.com: Unlocked, 2, Unsupported c598n34.pokprv.stglabs.ibm.com: Unlocked, 2, { 'CAS' } USERID@c598n34:~>

    支持的通讯状态:

    下表提供了MEP支持的有效通信状态。 预期的通信状态为2。

    0 –未知

    1 –不可用

    2 –通讯正常

    3 –通讯中断

    4 –无联系

    5 –通讯不受信任

    纠正措施:

    1. 如果服务器和操作服务器MEP的访问状态为锁定 ,则用户将需要执行锁定的 MEP的请求访问操作。 用户可以将smcli accesssys命令用于同一命令。
    2. 如果系统的通信状态不好,那么用户将需要在服务器和操作系统MEP上收集清单。 用户可以将smcli collectinv命令用于同一命令。
    3. 如果未显示所需的协议,则可以进行收集清单,然后再次进行所需的访问,然后撤消访问。
  5. VMControl激活状态 :检查VMControl是处于活动状态还是停用状态。

    清单5. VMControl激活输出

    USERID@c598n34:~> smcli lsmgrs Network Control : Activated VMControl : Activated Storage Control : Activated USERID@c598n34:~>

    纠正措施:

    • 停用状态:运行smcli activatemgrs VMControl命令以激活VMControl插件。 运行此命令后,重新启动Flex System Manager服务器。
  6. VMControl版本 :检查是否已安装所需的VMControl版本。

    清单6. VMControl版本输出

    USERID@c598n34:~> cat /opt/ibm/director/lwi/runtime/vmc/VMControl.properties # #Fri Sep 20 14:38:39 EDT 2013 com.ibm.vmc.build.buildDate=September 20, 2013 2\:38\:39 PM EDT com.ibm.vmc.build.number=187 com.ibm.vmc.build.timestamp=1379702319363 com.ibm.vmc.install.version=2.4.4.0-201309201405 USERID@c598n34:~>

    纠正措施:

    如果运行上述命令以读取VMControl属性文件未显示任何输出,则表明安装的Flex System Manager设备可能存在问题。

    在Flex System Manager中检查以下目录是否存在: /opt/ibm/director/lwi/runtime/vmc/ 。 如果不存在,则用户可能必须重新安装Flex System Manager构建。

  7. 网络控制激活状态 :检查网络管理器是处于活动状态还是处于停用状态。

    清单7.网络管理器激活输出

    USERID@c598n34:~> smcli lsmgrs Network Control : Activated VMControl : Activated Storage Control : Activated USERID@c598n34:~>

    纠正措施:

    • 停用状态:运行smcli activatemgrs Network Manager命令以激活网络管理器插件。 运行此命令后,重新启动Flex System Manager服务器。
  8. 存储控件激活状态 :检查存储管理器是处于活动状态还是处于停用状态。

    清单8.存储管理器激活输出

    USERID@c598n34:~> smcli lsmgrs Network Control : Activated VMControl : Activated Storage Control : Activated USERID@c598n34:~>

    纠正措施:

    停用状态:运行smcli activatemgrs Storage Manager命令以激活Storage Manager插件。 运行此命令后,重新启动Flex System Manager服务器。

IBM Power计算节点验证

应该在Flex System Manager中发现PureFlex System中的IBM Power计算节点,并且应该配置存储分区。 电源节点包括以下验证:

  1. 主机清单:检查主机清单是否最新。 主机清单不应太旧。

    清单9:lsresource输出

    USERID@c598n34:~> smcli lsresource Server 7346 | grep LastInventoryDate Property: Name: LastInventoryDate Type: dateTime Value: 2013-02-28T02:38:30-04:00 USERID@c598n34:~>

    纠正措施:如果清单早于1小时,则用户应再次在IB​​M Power计算节点上收集清单以检索有关主机的最新信息。

  2. 固件级别:电源主机应具有受支持的固件级别。

    清单10:IBM Power计算节点固件级别

    #lslic -t sys -m Server-7895-22X-SN10F599A | ecnumber ecnumber=01AF763

    纠正措施:如果此命令退出时未返回固件级别,则用户可以通过登录到Power主机的高级系统管理(ASM)控制台来尝试进行验证。 如果固件级别不是最新的,则可以通过从IBM Fix Central网站下载最新的固件来执行更新。

  3. 主机状态: Power主机应处于活动状态。

    清单11:主机状态

    hscroot@xhm2109:~> lssyscfg -r sys -m "pfm3128 8233-E8B-SN100BB7P" -F state Operating

    纠正措施:如果Power主机的状态显示为Power Off ,则用户必须通过从Flex System Manager控制台中右键单击主机,然后单击Start来手动启动主机。

  4. 主机具有一个或多个活动VIOS实例: Power主机应具有一个或多个活动VIOS实例。

    清单12:lssyscfg命令输出

    USERID@c598n34:~> lssyscfg -r lpar -m Server-7895- 22X-SN10F599A -F lpar_id,name,state 6,c612n75,Running 5,c612n77,Not Activated 4,c612n247,Not Activated 3,c612n251,Not Activated 1,VIOS_9-114-146-112_599A,Running 2,GA41-9-114-146-248,Running 7,mix-9-114-146-247,Not Activated 8,edit-9-114-146-247,Not Activated 9,defect-9-114-146-250,Running

    运行上面的命令将显示所有类型为lpar的系统的状态。 用户必须根据命名约定从上述输出中手动识别VIOS,并根据其检查状态。

    纠正措施:如果VIOS的状态显示为Not Activated ,则用户必须从Flex System Manager控制台手动启动它,然后尝试再次运行上述命令以检查状态。

VIOS验证

VIOS验证是PureFlex System环境的关键验证之一。 VIOS是位于逻辑分区中的软件。 该软件有助于在服务器内的客户端LPAR之间共享物理I / O资源。 这是VIOS验证的列表:

  1. CIM服务状态

    这将报告在VIOS上运行的CIM服务的状态。 CIM服务应已启动并正在运行,VIOS才能由Flex System Manager进行管理。

    清单13:cimserver的过程

    # ps -ef | grep cimserver root 10767 1 0 Sep25 ? 00:01:56 /usr/sbin/cimserver root 20492 20445 0 03:14 pts/16 00:00:00 grep cimserver

    纠正措施:如果CIM服务未运行:

    /usr/bin/ssh -l <loginId> <ip> /usr/ios/cli/ioscli startnetsvc cimserver
  2. RMC服务状态

    检查由Flex System Manager服务器插件托管的资源监视和控制(RMC)服务的状态,以与IBM Power计算节点进行对话。

    清单14:RMC服务

    # lssrc -s ctrmc Subsystem Group PID Status ctrmc rsct 6619344 active

    纠正措施:如果RMC未运行:

    /usr/bin/ssh -l <loginId> <ip> startsrc -s ctrmc`
  3. SLP服务状态

    该检查检查Flex System Manager服务器与VIOS通信所需的各种基本服务。

    清单15:slp_query命令输出

    # slp_query --type=* --address=<VIOS_IP> 0 8 59 URL: service:management-software.IBM:platform-agent://9.12.31.76 URL: service:wbem:http://9.12.31.138:5988 URL: service:wbem:https://9.12.31.138:5989 URL: service:wbem:https://9.12.31.76:5989 ATTR: (template-url-syntax=https://9.12.31.76:5989) URL: service:wbem:http://9.12.31.76:5988 ATTR: (template-url-syntax=http://9.12.31.76:5988 ) URL: service:management- software.IBM:usma://pva1076.pok.stglabs.ibm.com ATTR: (ip-address=9.12.31.76),(mac-address=aa.76.54.5b.f3.a), (tivguid=A42AD1481C7011E394FFAA76545BF304),(uid=7f8e6792373c6e72), (vendor=IBM),(System-Name=pva1076.pok.stglabs.ibm.com), (timezone-offset=-300),(version=6.3.2),(port=9510),(manager=9.37.74.106) URL: service:TivoliCommonAgent://pva1076.pok.stglabs.ibm.com:9510 ATTR: (ca-uid= file:///var/opt/tivoli/ep/runtime/agent),(am-host=9.37.74.106 ), (ca-ips=9.12.31.76),(ca-basic-port=9510),(ca-cert-port=9510), (ca-version=1.4.2.4),(os-uid=A42AD1481C7011E394FFAA76545BF304) URL: service:service-agent://9.12.31.76 ATTR: (service-type=service:management-software.IBM:usma,service:service-agent)

    纠正措施:

    如果有错误,则表明网络可能存在问题。 使用以下命令检查SLP服务是否正在VIOS上运行:

    ps -ef | grep slp

    如果没有启动并运行SLP服务,请尝试再次启动它,然后重试。

  4. CAS服务状态

    这是为了检查由Flex System Manager管理的VIOS上运行的CAS服务协议的状态。 此服务可帮助Flex System Manager与VIOS通信以执行任何操作。

    清单16:slp查询输出

    # slp_query –type=service:management-software.IBM:usma --address=9.12.31.76 0 1 66 URL: service:management-software.IBM:usma://pva1076.pok.stglabs.ibm.com ATTR: (ip-address=9.12.31.76),(mac-address=aa.76.54.5b.f3.a), (tivguid=A42AD1481C7011E394FFAA76545BF304),(uid=7f8e6792373c6e72), (vendor=IBM),(System-Name=pva1076.pok.stglabs.ibm.com), (timezone-offset=-300),(version=6.3.2),(port=9510),(manager=9.37.74.106)

    纠正措施:如果失败并显示“无法调用ICoreAgent”错误,则表明网络上可能存在问题。 网络问题可能是由以下问题之一引起的:

    • 代理与服务器之间的时间差不应大于给定的时区偏移值。
    • 代理连接器未激活。
    • 与代理管理器或端口9510相关的问题未打开。

    要在管理服务器或管理节点上打开端口9510,请在命令提示符下输入以下命令:

    telnet <ServerIP> 9510

    这是此服务的默认端口。 如果使用非默认端口,请使用该端口号验证CAS服务。

  5. 从VIOS到Flex System Manager ping

    通过ping通VIOS,可从Flex System Manager检查VIOS端点的状态和可用性。

    清单17:Ping输出

    # ping 9.12.31.76 PING 9.12.31.76 (9.12.31.76) 56(84) bytes of data. 64 bytes from 9.12.31.76: icmp_seq=1 ttl=236 time=24.0 ms 64 bytes from 9.12.31.76: icmp_seq=2 ttl=236 time=24.0 ms

    纠正措施 :如果发生故障,则管理节点之间的IP地址为:< IP_Address>。 VIOS无法建立。 验证网络连接,并确保它没有被防火墙阻止。

  6. VIOS许可证:

    该检查是为了查找VIOS的许可证是否已被接受。

    清单18:许可证检查

    $ license The license has been accepted en_US Sep 13 2013, 07:37:10 0(padmin)

    纠正措施:使用VIOS之前,用户必须查看并接受许可。 如果以上命令的输出显示不接受许可证,则用户需要执行以下操作:

    步骤1:要在en_US语言环境中查看许可证,请输入:

    license -view

    步骤2:要在fr_FR语言环境中接受许可证,请输入:

    license -accept -lang fr_FR
  7. VIOS通用存储库子代理状态

    这是为了检查是否在VIOS上安装了公共存储库代理,该VIOS用作承载映像存储库的映像控制点(ICP)。

    清单19:子代理输出

    # ./lwiupdatemgr.sh -listFeatures | grep im.cr com.ibm.director.im.cr.agent.installer_9.9.9.9-201308122037 Enabled

    负面情景

    # ./lwiupdatemgr.sh -listFeatures | grep im.cr com.ibm.director.im.cr.agent.installer_9.9.9.9-201308122037 Disabled

    纠正措施: VIOS上安装了公共存储库子代理。 但是,未启用公共存储库子代理。 使用以下命令重新启动管理系统以启用公用存储库子代理:

    /opt/ibm/director/agent/runtime/agent/bin/./endpoint.sh restart.
  8. VIOS固件

    这将检查运行VIOS计算机的固件级别。

    清单20:VIOS固件

    # lsconf | grep "Platform Firmware level" Platform Firmware level: AL780_006

    纠正措施:

    步骤1:使用PuTTY会话登录VIOS分区。

    步骤2:运行lsfware命令。 此命令的输出显示已安装固件的状态。

    步骤3:从Fix Central网站获取要安装的固件映像文件。

    步骤4:使用文件传输协议(FTP)将文件从PC或直接从Fix Central网站复制到VIOS。

    • 要使用FTP,请在PC上打开MS DOS提示符。 打开下载图像文件的目录。 在此目录中,对VIOS运行FTP命令。 使用有效密码以padmin身份登录。 现在,您已连接。 远程目录将是/ home / padmin。
    • 使用bin命令将传输设置为图像模式(二进制)。
    • 传输完成后,使用bye命令退出FTP。

    步骤5:验证固件文件是否在VIOS中。

    重新启动上一个PuTTy会话,或者如果已关闭上一个会话,则开始一个新的会话。

    如果您已使用FTP从PC传输文件,默认情况下,该文件将存储在/ home / padmin目录中。 如果使用FTP创建目录,则它将位于创建的目录中。 使用ls -l命令(目录名称: / home / padmin或/ home / padmin / firmware )。

    验证是否存在固件映像文件。

    步骤6:确保关闭了VIOS以外的所有正在运行的虚拟服务器。 如果未关闭它们,请采取必要的措施将其关闭。 请勿关闭VIOS。

    步骤7:安装固件:\ n \ ta。 发出ldfware命令以加载新固件。 命令语法为:

    ldfware –file /home/padmin/<firmwareFileName>.img

    要么,

    ldfware - file /home/padmin/firmware/<firmwareFileName>.img

    使用选项1确认固件安装。现在,刀片服务器将关闭并加载固件。 这大约需要10分钟。

    步骤8:确认固件已更新。 刀片服务器重新启动后,使用PuTTY重新连接。 发出lsfware命令,并验证是否已安装新固件。

  9. VIOS库存

    检查VIOS的清单是否最新/最新。 VIOS清单不应太旧。

    清单21:VIOS清单

    USERID@c598n34:~> smcli lsresources Server <VIOS_OID> | grep LastInventoryDate Property: Name: LastInventoryDate Type: dateTime Value: 2013-09-30T09:49:24-04:00

    纠正措施:如果清单早于1小时,则用户应再次在Power节点上收集清单以检索有关主机的最新信息。

  10. VIOS GUID的唯一性

    如果有多个VIOS实例,则每个VIOS实例都应具有不同的全局唯一标识符(GUID)。

    清单22:slp_query命令

    # slp_query --type=service:management-software.IBM:usma --address=9.12.31.76 0 1 66 URL: service:management-software.IBM:usma://pva1076.pok.stglabs.ibm.com ATTR: (ip-address=9.12.31.76),(mac-address=aa.76.54.5b.f3.a), (tivguid=A42AD1481C7011E394FFAA76545BF304), (uid=7f8e6792373c6e72), (vendor=IBM),(System- Name=pva1076.pok.stglabs.ibm.com), (timezone-offset=-300), (version=6.3.2),(port=9510),(manager=9.37.74.106)

    如果用户有多个由服务器管理的VIOS,则用户必须对每个VIOS运行此命令以验证GUID的唯一性。

    纠正措施:找不到GUID或GUID不唯一。 它类似于具有IP地址的另一个VIOS的GUID。 从管理节点删除VIOS,然后再次运行发现。

    代理服务之一[cimserver / cimlistener / tier1slp / Director公共代理]可能未在受管系统上运行。 使用stopsvc director_agentstartsvc director_agent命令重新启动代理服务。

  11. VIOS UID的唯一性:

    如果有多个VIOS实例,则每个VIOS实例应具有不同的唯一标识符(UID)。

    清单23:slp_query命令

    # slp_query --type=service:management-software.IBM:usma --address=9.12.31.76 0 1 66 URL: service:management-software.IBM:usma://pva1076.pok.stglabs.ibm.com ATTR: (ip-address=9.12.31.76),(mac-address=aa.76.54.5b.f3.a), (tivguid=A42AD1481C7011E394FFAA76545BF304),(uid=7f8e6792373c6e72), (vendor=IBM,(System- Name=pva1076.pok.stglabs.ibm.com), (timezone-offset=-300), (version=6.3.2),(port=9510),(manager=9.37.74.106)

    如果用户有多个由服务器管理的VIOS,则用户必须对每个VIOS运行此命令以验证UID的唯一性。

    纠正措施: VIOS的UID不是唯一的。 它类似于另一个VIOS的UID。 从服务器删除VIOS,确认管理型系统处于活动状态并且未被防火墙阻止,然后再次运行发现。 然后,验证日志以获取更多详细信息。

  12. 服务器和OS MEP的VIOS通信状态,访问状态和协议

    这将验证所描述的服务器和OS MEP协议的访问状态和通信状态是否已解锁,并且是否可以成功完成所有操作。

    清单24:lssys命令输出

    USERID@c598n34:~> smcli lssys -i 9.12.32.189 -A "AccessState,CommunicationState,Protocols" -t OperatingSystem c618b-m1b6.pok.stglabs.ibm.com: Unlocked, 2, { 'CIM', 'SSH' }

    支持的通讯状态:

    以下是MEP支持的有效通信状态的列表。 预期的通信状态为2。

    0 –未知

    1 –不可用

    2 –通讯正常

    3 –通讯中断

    4 –没有联系

    5 –通讯不受信任

    纠正措施:如果以上命令的输出不包含以上任何信息:

    • 验证管理节点是否存在托管资源。
    • 验证受管资源的访问状态是否处于OK状态。
    • 收集机箱和管理服务器上的清单。
    • 验证网络连接,然后再次请求访问。
  13. Flex System Manager到VIOS信息库子代理的通信状态

    验证Flex System Manager到VIOS信息库子代理的通信。

    清单25:getAgentInfo命令输出

    USERID@c598n34:~> smcli getAgentInfo 10.32.55.64 getAgentInfo is called.... Version: 2.4.3.0-201305151104 API level: 2 Bundle Info: May 15, 2013 11:04:54 AM EDT@65397 USERID@c598n34:~>

    负面情景

    USERID@c598n34:~> smcli getAgentInfo 10.32.55.48 getAgentInfo is called.... Error: No CAS agent! Error: Can not get the ICP agent: 10.32.55.48! USERID@c598n34:~>

    纠正措施:

    • 验证是否已安装CAS代理。
    • 验证是否安装了公共代理子代理。
    • 验证CAS服务是否正在运行。

翻译自: https://www.ibm.com/developerworks/aix/tutorials/au-pureflex-system/index.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值