随着互联网业务快速持续增长,IT资源使用量按需变化成为常态,这就要求信息部门能快速响应资源使用的变化要求,对运维提出不小挑战。比如电商、在线教育等企业经常推出一些秒杀、抢红包活动,在特定时间段对资源的利用处于高峰期,之后基本处于空闲。
几年前,我们从申请采购到应用部署上线都只能人工操作,需要提前几个月开始规划。如今通过云平台能很好实现资源按需动态管理,运维人员可在云平台上根据实际业务需求申请或释放资源。但申请到虚拟机之后,还是需要按照传统方式从人工部署应用系统,根据工作规范一步步操作,这种方式还是很难应对服务变化快速响应的需求,给运维人员也带来不少的工作量。
所以我们需要从创建虚机到部署应用整个完整链条的自动化能力,当业务量上升时,能自动增加应用服务来满足上升的业务访问量;当业务量下降时,能自动缩减应用服务。以此达到让应用服务具有弹性伸缩的能力,保证应用稳定性和高可用性,同时也起到提升数据中心资源利用率的作用。
优云Automation具有云基础架构到业务应用的全栈自动化交付能力,可以便携的实现应用服务自动扩缩容,下面我们以优云官网自动扩缩容为例给大家介绍。
一、业务需求分析
优云官网的业务应用架构(如下图)包括负载层、应用层、存储层,目前部署在阿里云上,其中应用层使用微服务化以及无状态设计,支持水平扩展能力。
假如双十二要举办一个互动活动,为了保障业务稳定运行,需要对业务应用层的主机进行监控,当CPU利用率持续大于60%后,自动往集群里增加1台机器,并能自动部署好应用服务上线接入运行。当CPU利用持续小于20%的时候,缩减1台机器。
二、内置操作复用
Automation内置了满足各种运维场景的自动化操作,如云环境管理、数据库中间件管理、应用部署、日常运维等。云环境管理方面提供了阿里云、VMware、OpenStack的支持,优云官网部署在阿里云,所以我们主要使用阿里云管理相关的操作。内置阿里云操作可实现ECS实例的创建、修改、销毁、启停和查询等全生命周期管理,也可以通过平台灵活定义私有操作满足各种运维场景。
扩容场景需使用到阿里云ECS创建、启动、查询操作,实例启动后需自动安装操作Agent,之后安装、启动Tomcat服务、部署应用包以及负载均衡配置和重载生效。
上图为创建“阿里云ECS实例”的操作信息:
1)输入参数:integration_info、vm_conf;
a)integration_info为系统集成配置参数,可通过集成界面配置阿里云服务器地址、AccessKey、SecretKey等信息;
b)vm_conf为实例配置参数,支持区域、网络、安全组、实例类型、镜像等配置,接受JSON格式,如下:
2)输出参数instance_id:指创建后的ECS实例ID,后续操作需使用该ID。
三、场景编排实现
有了操作之后,我们可以将操作串接起来形成满足自动扩容的编排流程。Automation提供可视化的流程编辑器,可按扩容处理步骤一步步添加操作,前一个操作输出参数值可被之后的操作引用,实现数据传递。
以下是自动扩容编排流程,自动缩容更加容易实现。
整个编排执行过程如下:
1)创建阿里云ECS实例:根据系统集成、实例配置信息在阿里云上创建实例并输出实例ID;
2)启动阿里云ECS实例:通过系统集成配置、引用第一步输出实例ID参数信息来启动云上的实例;
3)实例IP查询:通过系统集成配置、引用第一步输出实例ID参数信息来查询云上的实例信息并输出IP地址;
4)安装Agent:根据前面任务的输出信息,在目标虚拟机上安装优云Automation Agent;
5)安装Tomcat:自动下载Tomcat安装包并进行安装,参数信息以及执行主机引用第三步输出IP地址;
6)部署应用包:配置业务应用包、部署目录等参数信息以及执行主机引用第三步输出IP地址来部署应用包到Tomcat服务下;
7)启动Tomcat:根据前面任务的输出参数信息来启动Tomcat服务;
8)负载均衡配置:在前置负载均衡上配置新增转发实例IP地址;
9)负载均衡配置重载:重载负载均衡器以让其生效。
四、自动触发执行
系统支持手工、定时、API三种方式执行编排,其中API支持RESTFul协议,调用时可传递编排参数值。为实现动态自动扩缩容,我们采用优云Monitor进行主机负载监控,当监控到应用服务器CPU负载持续高于60%时,自动调用Automation API的编排执行接口来完成自动扩容,如下图:
调用后作业执行详情如下:
我们可以查看每个任务的执行详情,比如创建阿里云ECS实例:
阿里云上看到的实例信息如下,扩容已经自动完成:
优云Automation已经内置支持多种云平台,也会持续完善各种云资源的自动化管理支持,我们可以得到一个公式:IT服务弹性伸缩利器=云平台+优云Automation。
作者:叶军会