这篇文章的标题起的有点大,那是因为试用过蓝鲸社区版后,真正体会到了一个统一运维平台带来的高效运维体验是多么的舒爽。接下来就简单介绍下蓝鲸这么个神器。
在介绍之前,先对运维行业的发展历程做个梳理。
发展历程
手工操作->脚本自动化->web自动化->调度自动化->智能化运维
手工操作: 比较原始的运维模式,一切靠肝,在这个阶段,7*24小时,满负荷工作是常态。
脚本自动化: 这个阶段的运维人员具备一定的脚本能力,能编写较复杂的脚本,充分利用crontab定时器,基本上实现一键巡检,摆脱了部分繁复的工作;
web自动化: 市面上开始出现了一些运维产品,市场也是感受到了运维人员的辛酸啊。当然大部分产品还是仅支持通用功能,无法实现定制化配置。同时针对运维工作的不同类型,衍生出了花样繁多的产品,主要有自动化类产品(代表产品ansible、awx),监控类产品(prometheus、zabbix),但是对运维人员来说这一个又爱又恨的阶段,工具多了,但是学习成本上去了。
调度自动化: 运维涉及的工作种类越来越复杂,此时需要一个统一调度平台负责各个模块的正常运维工作,协调分配资源。顾名思义,运维工作不再是一股脑地肝,而是按照一定的经验和既定的制度合理化推进运行。
智能化运维: 据我了解,这个境界现在国内没有几家公司达到,毕竟人工智能的发展还处于初级阶段,更多的还是应用在工业领域。基于人工智能不妨大胆畅想下未来的运维工作模式。基于上一个阶段的调度更加合理且智能化;作为运维人员更多的应该是定义规则,输入到智能体系,对最终的结果负责即可。真正实现零过程参与。
蓝鲸体系
说了这么多,接下来介绍下蓝鲸的几大基础功能,先附上蓝鲸的体系架构图,对我们使用人员来说只要关心PaaS和SaaS部分的内容。
蓝鲸 是一套用于构建企业研发运营一体化体系的PaaS开发框架
其核心优势
PaaS 理念
软件的整个设计是基于 PaaS 理念,非侵入式地与企业已有的系统结合,支持横向扩展。
原子平台
底层由各原子平台组成,各平台专注于自身的功能建设,以便上层的场景类 SaaS 可以灵活、高效研发定制化系统。
开放生态
不仅提供了丰富的 API,而且在不断提升开放的力度,官方核心产品提供了插件式 / 二次开发(开源项目)的模式,促进运维生态发展。
企业赋能
通过线上线下的公开课、认证考试、运维开发挑战赛等多种模式,赋能企业,提升企业技术能力,让企业员工具备自建系统的能力。
平台介绍
管控平台
蓝鲸管控平台是蓝鲸体系的底层管控系统,是上层运维服务体系与底层 IaaS 的连接器,为上层提供指令、文件、数据的通道,支持直连模式、代理模式以及为达到最优连接指定级联路由的模式。管控平台是典型的两层分布式 C/S 结构,主要包含智能的蓝鲸 Agent、提供各种服务的 Server 以及 ZooKeeper、Redis、MySQL 等周边保障模块。其中蓝鲸 Agent 是部署在业务机器上的程序,每台业务机器仅部署一个蓝鲸 Agent,其他模块部署无具体要求,用户可以单独部署,也可以混合部署。
在整个蓝鲸体系中,管控平台无需直面用户,但其在体系中却是不可或缺的,它为其他平台模块提供了人机交互的通道与能力。管控平台主要提供了三种类型的服务能力:文件分发传输能力、命令实时执行与反馈的能力、大数据采集与传输的能力。
配置平台
蓝鲸配置平台(CC)是一款面向应用的 CMDB,在 ITIL 体系里,配置管理数据库(CMDB)是构建其它流程的基础,配置平台作为面向业务层面的 CMDB, 为蓝鲸体系的其它平台提供了各种运维场景的配置数据服务,存储与管理企业 IT 架构中设备的各种配置信息,它与所有服务支持和服务交付流程都紧密相联,支持这些流程的运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性。配置平台提供的主要功能有主机管理、业务拓扑、业务管理、资源池管理、自定义属性管理、操作审计等。
作业平台
蓝鲸作业平台(Job)是一套底层基于管控之上的基础运维操作平台,并且具备海量的并发处理能力,除了支持脚本执行、文件拉取 / 分发、定时执行等一系列可实现的基础运维场景以外,还运用流程化的理念很好的将零碎的单个任务组装成一个作业流程。同时,可通过平台提供的 API 实现对任意作业的调用、查看等操作,与其它平台或系统联动,实现调度自动化。作业平台的主要功能有:快速传输文件、web 化脚本管理、支持批量高效执行、流程式管理,一切皆 “作业” 等。
PaaS 平台
蓝鲸 PaaS 平台是一个开放的平台,又称蓝鲸 PaaS,让用户可以简单、快速地创建、部署和管理应用,他提供了完善的前后台开发框架、服务总线(ESB)、调度引擎、公共组件等模块,帮助用户快速、低成本、免运维地构建支撑工具和运营系统。PaaS 平台为一个应用从创建到部署,再到后续的维护管理提供了完善的自助化和自动化服务,如日志查询、监控告警等,从而使用户可以将全部精力投入到应用的开发之中。PaaS 平台的主要功能有:支持多语言的开发框架/样例、免运维托管、SaaS 运营数据可视化、企业服务总线(API Gateway)、可拖拽的前端服务(MagicBox)等。
节点管理
一款设计用于在浏览器端进行后台服务管理的的应用。目前的版本中,支持 gse_agent 的安装与升级,满足用户直观简便的在受控主机上部署 Agent 及管理 GSE 插件。
日志平台
蓝鲸智云日志平台是为了解决运维场景中查询日志难的问题而推出的一款 SaaS,基于业界主流的全文检索引擎,通过蓝鲸智云的专属 Agent 进行日志采集,无需登录各台机器,集中管理所有日志。
监控平台
监控平台是一款针对主机和互联网应用进行监控的产品,监控服务可用于收集主机资源(系统性能、组件服务、数据库、日志等)的监控指标,探测互联网应用服务的可用性,并对指标进行告警设置。
故障自愈
故障自愈是一款实现服务器故障自动处理的解决方案,提升企业服务可用性和降低故障处理的人力投入。通过自动化处理来节省人力投入,通过预定的恢复流程让恢复过程更可靠,通过并行分析达到更快的故障定位和恢复,最终减少业务损失的风险。
标准运维
标准运维是通过一套成熟稳定的任务调度引擎,把在多系统间的工作整合到一个流程,助力运维实现跨系统调度自动化的 SaaS 应用。
平台关联图
如果您喜欢我的文章,请关注我哦。后续会提供更多的干货分享。