简介
本篇介绍OPS - 并行控制系统的设计模型。
为什么要有这个系统?
在OPS过程中,服务器初始化,批量执行(信息获取、服务配置)等的任务,而且在目前我们的OPS过程中,处在一个十分尴尬又十分有趣的未知,我们属于二次运维,服务器交付、统一初始化已经有控股公司IDC部门直接搞定,我们作为一级部门要对服务器进行二次运维,定制我们需要的一些配置文件,所以即使有puppet等自动化运维软件,我们也尽量避免使用,使用最简单最原始的组合,在不破坏服务器现有环境的情况下完成我们的OPS任务。
在过去一段时间里,我们主要借助CI(Jenkins)来进行服务器的维护,因为CI服务器可以免密码登陆其他服务器,但是性能还是并发量都是问题,而且本身CI承载着CI CD(可持续集成、可持续发布)的任务,我们只能利用一点点资源,顺序批量执行各项任务,相当于单行道,机器稍多一点,OPSer就得等待,这个可以解决。
这个系统有哪几部分?
控制部分
控制部分由Jenkins搭建,一个Master,若干Slave(可以进行添加)
被控制部分
也就是需要运维的服务器
触发部分
这个也就是如何将这个多米诺骨牌触发。由OPSer进行触发,但是前提是,OPSer需要再Jenkins预先部署好Project以及触发需要的token。