摒弃“短板”——数据中心基础设施运维管理建议书

数据中心是数字基础设施的重要组成部分,同时也是一整套复杂的设施。它不仅仅包括计算机系统和其它与之配套的设备(例如通信和存储系统),还包含冗余的数据通信连接、环境控制系统、监控系统以及各种安全系统。运维管理又是数据中心在运营过程中历时最长的一个阶段。如何确保数据中心安全、可靠、高效的运行则是运维人员工作内容的重中之重。

在数据中心网络运维管理过程中,运维人员要对数据中心的网络构成、业务走向、设备相互连接关系等做充分的了解。据了解,现有的管理方式大多是将数据中心初建阶段的数据通过表格、图纸、文档等方式整理好,然后在以此为基础作为后续的变更规划,排障宝典。然而,事与愿违,实际工作中总会有不同的原因促使实施人员不按规范操作、数据变更不及时,重要文件丢失等,当遇到突发业务故障,手忙脚乱,翻遍表格、图纸,耗时耗力不说还影响客户对运维工作的满意度。

那么,既然现有管理方式并不是那么的有效,是否可以借助一些运维管理工具来完善我们的基础设施运维工作呢?

据了解,目前用于数据中心运维管理的工具有动环系统、监控系统、网管系统以及3D可视化系统,然而各个平台都是独立的,甚至不同品牌设备的管理系统也是独立的,运维人员日常维护需要登录多个系统,并且在其间来回切换。除此以外,以上都是针对有源设备开发的管理系统,然而往往造成系统故障的原因可能只是运维人员不小心碰掉了某根光跳线。可见仅仅只是管理硬件并不能解决根本问题。

“一只木桶盛水的多少,并不取决于桶壁上最高的那块木块,而恰恰取决于桶壁上最短的那块。”由此看来,高性能的设备可能会扩大计算、存储、分析以及灾备等能力,然而一根线缆的故障却能使其前功尽弃。由此可见,庞大的线缆管理难题始终都是数据中心运维管理这个木桶中最短的那块木块。

结合以上,小编认为有效的基础数据及线缆管理结合现有的有源设备管理系统,通过数据互通,相互补充汇总、进而分析报告,才能完善现有运维管理方式,使运维管理系统成为运维人员的股肱心腹。

一、基础数据管理

基础数据包括:地理位置、园区范围、建筑外观、楼层机房数量、机房内部设备位置、机柜类型、机柜U位、设备外观、设备板卡、设备/板卡端口、线缆等。

管理方式:运用地图、图纸、图片等素材以层次化的方式建立图形可视化的网络基础设施数据库。

管理内容:地理位置、外观、名称编码、品牌、类型、数量、占用情况、线缆连接关系、端口流量、维护人员等等相关需要记录、管理的信息。

实现方法:可根据情况选择手动创建或通过插件使用Excel/WPS批量导入创建。

实现效果:

  • 快速查询定位设备、板卡、端口、线路
  • 室外网络基础设施快速查询定位
  • 光纤状态显示与业务定义查
  • 前端点位—可视化定位查
  • 电力连接可视化查询
  • 设备文档关联查询
  • 对端分析—快速查看机柜内设备间连接
  • 链路分析—自动生成物理链路
  • 拓扑分析—自动生成物理拓扑
  • 路由分析—动态跟踪线缆桥架
  • 机房容量分析
  • 自定义多维度分析报表

二、线缆管理

  • 自动推荐链路
    新增设备时,系统可根据预设的设备模型端口类型及端口标准,自动推荐可以使用的线缆类型。
  • 自动线缆长度测量
    创建线缆连接的同时自动测量出两台设备之间应使用的线缆长度。
    规划人员无需经过繁琐的审批手续进行现场勘察工作,就可以获得较准确的线缆长度,规划的同时,即可定制出较准确的材料清单。
  • 自动生成标签编码打印
    系统每一根新增的线缆都可按照预设的标签规则(TIA 606B标准或用户自定义),自动生成标签编码,通过API接口实现编码列表自动传递至标签打印软件,运维人员可按需打印标签使用。
    众所周知,运维工作中标签的工作量巨大,人工编制百密一疏在所难免,有了这个功能运维人员即可从繁杂的标签工作中解脱出来,有效避免错误的同时,极大的提高了工作效率。
  • 自动生成任务工单
    对于规划新增的线缆,系统会自动生成工单任务,可以根据实际需要批量发送给实施人员。
    两台设备之间用什么样的线缆,长度多少,数量多少,起始端口,终止端口一目了然,工单任务清晰直观。实施工作也相对简单许多,无需反复沟通确认,只需在完工后拍照反馈即可。
  • 线路路由查询
    通过线缆可查找这根线缆连接的本端设备端口与对端设备端口。
    通过端口我们可以了解这条链路所承载的业务方向,端口通过SNMP协议可实现故障报警、流量监测等功能,当该业务终端出现故障时,可快速排查故障点,提高除障效率。

三、与有源设备管理系统结合

  • 开放的RESTful API,方便第三方系统导入和查询数据。
  • 基于AMQP的消息总线,实时发送资源变化消息至第三方系统。
  • 实时采集开启SNMP协议设备的数据。
  • 能够从系统内部启动外部应用程序和脚本。
  • 能够与IT服务管理ITSM、流程、网管、监控等系统快速集成。

通过与第三方系统对接,运维管理人员可以全方位的了解整个数据中心基础设施的运行状态,快速处理日常业务需求及故障排除工作。

数据中心基础设施运维工作道阻且长,为响应国家号召“加快数字化发展,建设数字中国”。我们运维管理人员也要时刻保持创新,不能让“短板”拖累了我们紧随时代发展的步伐。

文:孟敏


  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

nVisual

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值