上班不偷懒怎么能赚钱?
偷懒的概念
当然这里的偷懒并不是说不干活,而且是通过其他方式将日常工作中计划性的,反复的,机械性的任务汇总,整理;缩短任务执行的时间。比如说通过脚本或自动化的方式来提高工作效率,变相偷懒。
自动化
所谓自动化运维,实际上需要利用一些开源的自动化工具如:ansible、saltstark、puppet 等这些比较常见工具,管理服务器及服务。说白了就是批量管理服务器工具。帮忙运维解决重复性工作的。
甲方需求
在代维NOC的日常工作中,存在大量重复性工作。
举个栗子:
按照要求,每日需要对所有网络设备进行巡检,并保存日志。
网络设备厂商包含思科、华为、贝尔等等。
对日志进行必要的分析,发现可能的隐患、告警并及时处理。
-分析
从上述需求来看,在网设备超过200台,包含各厂家的主流型号设备,还有部分上古时代的设备。
所有设备光采集信息就耗时巨大,且还需要对日志进行分析,及时发现问题。靠人工操作还要再做0容错,完全不现实。但是存在大量的开源工具可以使用,通过snmp采集数据,通过syslog记录日志。
在与甲方沟通后得到结果,出于安全考虑,不允许通过snmp、syslog采集数据。且过去因设备数量较少,这些工作由人工完成,只允许登录设备show 、display查看相应信息。
这活是给人干的吗?!?!?!?!
-实现
所有现有开源工具的大门被关上了,但是需求最终还是要满足的。所以只能自己动手丰衣足食。
-Python
通过更进一步分析巡检要求,理顺巡检逻辑,决定使用python编写巡检脚本。
甲方设备通过tacasc统一管理,且tacasc服务器响应速度较慢,无法通过传统的except来解决,即使登录成功设备也未必处于可操作状态,通过Python实现。
不同厂商,不同型号的设备返回数据存在无法显示的非空字符,避免之后自动比对出现差错同时便于事后人工追溯,需要适配处理:
由于设备响应速度和tacasc服务器限制的存在,巡检速度并没有比人工快多少。
但是它会自己巡!
不说了,该摸鱼了。
来自上海世纪互联摸鱼达人王倩炜的分享