作者将本文同时发布到:EMC中文支持论坛https://community.emc.com/docs/DOC-21662

介绍


VNX/CLARiiON存储,平常的Unisphere/Navisphere 网页管理界面侧重于配置和监控,而要从整理上把握存储阵列运行状况,通常需要做健康检查。定期的检查,可以主动预防故障,降低故障发生率。用户可以通过存储管理工具Unisphere Service Manager (USM)或者命令行实行健康检查。本文将介绍使用命令行的方法。

USM工具做健康检查 ,请参考文章https://community.emc.com/docs/DOC-17148

更多信息


综合检查


  1. 在客户端安装最新版的Navisphere Secure CLI,下载链接为https://support.emc.com/downloads/7948_Navisphere.

  2. 进到命令行窗口C:\Program Files\EMC\Navisphere CLI (默认安装目录)

  3. 运行 naviseccli -h <sp_ipaddress> getagent.  该命令返回设备名称和存储系统的配置信息。

  4. 运行naviseccli -h <sp_ipaddress> getcache. 该命令返回SP缓存信息。确保读写缓存都在已启用状态。

  5. 运行naviseccli -h <sp_ipaddress> getcrus. 该命令返回CRU(用户更换单元)FRUEMC工程师更换单元)信息。

  6. 运行naviseccli -h <sp_ipaddress> faults -list.   该命令返回阵列的所有的报错。


检查SP

  1. 运行naviseccli -h <sp_ipaddress> getall -sp.  显示SP相关信息。

  2. 确认系统报错显示灯是否OFF,读写缓存是否启用,是否配置正确。

  3. SPB上重复上述操作。


检查连接情况

  1. 运行naviseccli -h <sp_ipaddress> getall -hba  或者  naviseccli -h <sp_ipaddress> port -list  显示交换机、HBA、端口信息。

  2. 检查端口状态

        Status:         Up

        Port Status:    Online

        Switch Present: YES

  3.   如果主机的状态是未登陆(logged in), 需检查zoning配置是否正确。

  4.  运行naviseccli -h <sp_ipaddress> connection -getport -all.该命令将返回iSCSI配置,如果返回结果很长建议用syntax >(filename).txt保存后再分析。



检查LUN状态

  1. 运行 naviseccli -h <sp_ipaddress> getlun -rc 确保LUN的读写缓存都启用。


检查掉线unowned LUN

  1. 运行naviseccli -h <sp_ipaddress> getlun -owner default. 检查是否有LUN掉线即没有owner

  2. 如果发现某个LUNOwnerN/A即没有owner,而此LUN又不是Private LUN,请及时联系EMC技术支持。

检查磁盘状态

  1. 运行naviseccli -h <sp_ipaddress> getdisk -state  检查磁盘状态是否是正常Enabled

  2. 如果磁盘状态显示removed或者Requested,请及时联系EMC技术支持


在联系EMC技术支持前,需收集SPCollects ,命令行如下:

  1. 运行 naviseccli -h <SP_IP_address> spcollect 启用收集SPCollects,大概需要等待10分钟左右 。

  2. 运行 naviseccli -h <SP_IP_address> managefiles -list  会列出所有的SPCollect

  3. 运行 naviseccli -h <SP_IP_address> managefiles retrieve可以将SPCollect下载到本地。



应用于


VNX/CLARiiON系列