中间件集群智能管理思考

最新推荐文章于 2023-11-13 11:34:58 发布

华莲

最新推荐文章于 2023-11-13 11:34:58 发布

阅读量123

点赞数

文章标签：自动化系统架构中间件

原文链接：https://qcon.infoq.cn/2020/shanghai/schedule

版权

（1）当前问题与挑战

A.如何发现应该使用哪个中间件集群？

B.如何监控中间件集群是否可用？

C.如何在中间件集群不可用时，实现行快速失败转移？

D.如何让应用里的中间件客户端内部运行状态可视化？

E.如何从中间件的维度，监控其使用情况？

F.如何简化客户端提供诸多参数的配置？

（2）中间件集群智能管理思考

针对上述问题与挑战，整体解决思路如下：

（3）组件配置集中管理

A）低级阶段：直接在“应用层”进行配置；即通过配置Eean的属性+应用文件配置，优势为Bean配置更简单更直接。

B）终极阶段：通过“配置中心”进行配置；即直接配置中间件集群地址、从应用维度配置参数等，实现组件参数自动装配与中间件服务地址的自动发现。

C）高级阶段：实现“集中统一的配置管理“；即兼顾应用与中间件维度管理配置、服务地址通过命名服务智能路由。

组件参数统一配置：可以简化开发配置，提升效率；⾃动⽀持新增属性配置，⽆须代码改动；属性⾃动装配，可以建⽴配置Key/Bean 的绑定关系，⽀持变更热⽣效；⽀持组件视图，概览同⼀组件配置情况等等。
中间件命名服务：可以通过serviceType + serviceId⾃动发现中间件服务地址，并注⼊到客户端，实现智能路由功能；快速感知中间件服务地址的变更并⽣效，实现中间件的⾼可⽤和⾼稳定等等。

（4）运⾏组件内部可视化

（5）中间件集群高可用管理

（5.1）集群可用性的威胁因素

（5.2）系统可用性度量

系统可⽤性 = 系统可⽤时间 / (系统可⽤时间 + 系统不可⽤时间） = MTTF / (MTTF + MTTR） = MTTF / MTBF

（5.3）中间件高可用管理

设计：优质的设计需要花费20倍的精力，实现需要花费3倍的精力，部署只需要1.5倍精力。能够实现分而治之，即可复制、垂直分拆、数据分片等。实现面向故障编程，即可开关、可回滚、可管控等。实现可监控、可运维。

监控与故障转移（步骤）：

（6）SRE的愿望

关注