听说北京大学的保安在你进门的时候都会问三个终极的哲学问题:你从哪里来?你到哪里去?你是谁?寻寻觅觅,曾几何时,我们也一直在寻觅WeCube的三个灵魂问题的答案 - 为什么要做WeCube?WeCube是什么?WeCube未来的发展方向?
为什么要做WeCube?
业务场景决定了技术的演进和发展,在过去的二十年时间里面,IT的世界经历了三个阶段的变化 - 单机,集中,分布式 。单机时代的系统管理员一般多才多艺,身兼数职,从拉网线、修电脑、装系统到用户培训,无所不能,堪称人肉运维的典范(作为一名20年经验的IT人员,我在入行的时候,就曾经作为系统管理员,帮用户修理过放电脑桌,因为它也是支持系统运作的关键部件^-^); 第二阶段,企业都已经进化到了大集中时代,公司的业务系统集中于几台高端服务器,以及在高端服务器上运行的若干个复杂应用。这个阶段的运维人员已经有一定的专业化分工了,网络工程师、系统管理员、业务系统运维应运而生。技能方面,脚本为王,运维工程师们使用Shell,Python,Perl脚本提代了繁重的重复命令,甚至能够完成一些逻辑和场景相对复杂的自动化实现;第三阶段,随着业务形态的互联网化,以分布式、微服务、灰度发布为代表的IT系统成为了主流,这个时候运维就要面对更加复杂的IT场景,管理的机器从原来的几十台,变成成百上千台,而且上面部署着不同的微服务,原来单纯靠批量脚本的运维就已经难以为继了;同时,原来一个月,甚至几个月一次的停机发布,也演变成每天都会有的不停机滚动发布;而且发布的复杂程度也大大增加了,例如做一次业务部署,运维同学可能既需要安装服务器,做系统配置,又需要更改软件包,启停进程,最后还要配置负载均衡服务等等。这个时候就需要一个流程将一个个的脚本串联起来,并依据执行结果进行逻辑判断。
从上文第三阶段的举例,我们会发现互联网世界的运维对流程和工具平台有了现实的和必然的述求。毫不夸张的说,如果不配套输出适用于互联网IT系统的运维流程和工具平台,我们是无法赋能合作伙伴的,因为他们没有技术承接力来维护微众输出的基于分布式的IT系统。因此,作为分布式商业科技发展部开发平台研发室,我们选择WeCube作为我们第一个研发目标,希望WeCube可以赋于合作伙伴驾驭分布式IT系统的能力。
WeCube是什么?
WeCube是轻量级分布式架构的管理平台。或者用大白话来说,WeCube是一个服务于分布式IT系统的管理工具平台,可以通过插件扩展的方式为用户提供架构规划、资源管理、应用部署、系统监控、问题管理等基础运维管理能力,并在未来提供容量分析、根因分析等高阶功能。
软件架构层面,WeCube分为2个部分 - 平台(Platform)和 插件群(Plugins)。
插件是WeCube业务能力的唯一来源,每一个插件都能够提供相对独立和完整的一项能力(包括前端UI、后台API、及持久化),例如CMDB、问题管理、资源管控、应用部署等。所有插件可以在遵循插件开发规范的前提下,独立开发,注册,部署,和运行,彼此之间解耦合;插件与插件之间的协同,需要在注册之后,通过平台(Platform)来完成。通俗来说,插件就是实现了某项IT管理能力的微服务。
平台(Platform)则为具有业务能力的微服务插件提供前端框架、运行资源、插件注册、服务治理、服务编排和任务运行。
前端框架秉承微前端的设计理念,提供基座以支持各插件UI的插拔,并提供前端路由服务,和基于Event Bus的插件UI之间的通信模式
运行资源,特指WeCube插件的运行(不是业务系统)所依赖的资源,例如容器、数据库、对象存储等。此模块提供运行资源的管理能力(创建、销毁、监测、分配),并可以在插件注册的时候提供资源分配功能,以及当插件注销的时候进行资源释放。
插件注册:插件需要进行平台注册,才能够运行。注册的时候插件需要提供 - 数据模型、服务接口、接口数据绑定规则,并申请资源(容器和持久化)以支持插件的运行。
服务治理:插件提供IT管理服务,而这些服务的请求分发,权限控制,限流熔断等服务治理均有平台来实现。
插件编排:通过BPMN提供插件各服务的编排组合功能,将各插件服务一个个串联起来,并根据返回结果进行逻辑判断。
任务运行:编排的运行实例就是任务,提供任务的运行环境,例如:插件入参准备、执行结果回写、超时异常处理等。
WeCube未来的发展方向?
WeCube未来在技术和产品的发展方向主要是对容器化的支持和AI Ops。
目前,以Docker容器和K8S为代表的容器技术已经逐步成为PaaS建设体系的标准,与之配套的生态也日趋成熟和完善,融合技术或者工具,如果不能够兼容和适配容器和K8S,那么它将很难得到业界认可,并生存下去。
AI Ops的建立在Ops自动化和海量数据之上的AI应用。AI善于快速的发现问题和定位根因,问题一旦找到,就依赖自动化的Ops进行调整 - 扩容、熔断、限流。AI Ops的发展是一个长期和逐步演进的过程,容量趋势分析、根因定位、智能调整都是未来WeCube高级插件需要提供的功能。
最后,在商言商(All is business),WeCube未来会展现其对立的两个面 - 开源和商业化。在开源社区,我们要以开放的心态和态度促进WeCube平台(Platform)的建设,不仅仅是微众,我们还需要吸引更多的合作伙伴加入,打造一个开源、开放的轻量级分布式IT管理平台,尽可能的兼容/适配各种不同的场景和环境,已经合作伙伴现有的工具。这个开放的体系能够作为微众开发平台的基础支撑,也同时能够吸引大量的潜质玩家而建设合作联盟;另外一面,开源社区我们只提供可运行基本功能的简单插件,他们可运行,但是不完美。因此,我们会研发一个具有高阶功能的闭源插件 - 例如容量管理、根因分析,这些闭源插件将来会通过License授权和咨询服务的方式为WeCube带来商业收入,从而使得整个事情在商业上是可持续的。
从设计理念来说,WeCube就是一个“框架”加“插件”的设计,可运行但是不完美。但是正是这些不完美,才让我们有机会通过插件的方式来完善它,而得到一个独一无二的WeCube。