网络部门运维职责

故障处理及故障记录

接收报障:

  • 需要故障发生时的双向MTR截图和ping数据,此动作可与直接报给供应商同步进行,并及时记录故障发生时的时间,然后仔细查看mtr的路径和丢包情况,判断分析是哪个地市出现的问题,并督促IDC及时联系运营商介入处理。如遇到重大,波及面广的故障及时上报。

报障处理:

  • 遇到故障及时登陆交换机,检测平台内部网络情况,查看相应服务器对应的设备接口情况,诸如:光模块收发光情况,端口error情况,光纤链路问题,查看Log,查看交换机性能情况(CPU、内存、温度、电源、健康检查)。相应traceroute判断问题节点,作为凭证再次报给IDC,加快定位故障和处理速度。

故障完成:

  • 大多数故障需要当即处理完成,记录处理恢复时间,及详细的故障处理过程(储备故障处理经验),如果为IDC问题,需要IDC的盖章函件作为故障报告的凭证发邮件到netgroup,如果为ISP问题,则需要ISP盖章加IDC盖章的函件发至邮箱。函件中的时间和我们记录的时间需要沟通协调一致。

机房设备统计

  • 凡是在IDC机房的所有设备及硬件(交换机、服务器、光纤、模块),均为我们固定资产,要求IDC妥善保管,如果有坏件要打上相应问题的标签(模块无发光,丢包,error包,光弱等问题的描述),要求机房不得擅自丢失和遗弃任何硬件。
    记录:网路部汇总表.xlsx 汇总记录硬件信息

机房设备上架下架

  • 新增选点机房,和采购部确认发货数量,确认硬件包括:交换机、服务器数量及类型、光纤、模块。并且同时督促尽快办理相应实施工单,包括但不限于施工工单、设备上架工单、设备加电工单、接收设备收货人等信息,尽可能避免设备延期上架使用。上架后开机进行一系列测试方可交给业务部门。
    机房设备下架需要对比发货数量,核对后通知IDC人员进行下架操作,下架后对相应设备进行包装避免运输中对设备有损坏的危险,发货地址和采购部进行确认,并且得到快递单号后及时反馈给采购部。
    机房对设备操作后需要填写回执单,我们核对无误后留存。

设备验收检查

  • 按照业务的要求,检查设备是否可以正常使用,硬件是否满足额度要求,需对服务器进行相应排查。
  • 服务器硬件检验的同时,检查所有设备的配置情况,包括ip、掩码、端口描述、设备命名等,测试网络环境,诸如ping、traceroute到公网ip、三线资源是否有问题。无问题后方可使用。

网络巡检

  • 利用监控系统,查看每日流量使用情况,24小时为一周期(9:00),结合syslog查看每日的故障报告,和端口状态等信息。
    利用zabbix微信故障提醒功能,可实时监控平台主机情况,问题发现后及时处理解决。
    周期性观察流量增长(下降)情况,预先获得趋势信息,可在必要时采取行动。
    流量统计可以更直观也会更可观的说明问题,了解平台每日out峰值可得知高峰时段用户使用情况,也可根据95计费原则对平台流量进行重规划,分摊流量。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值