搭建一个通用监控告警平台，架构上需要有哪些设计

最新推荐文章于 2024-05-23 18:57:02 发布

倾听铃的声

最新推荐文章于 2024-05-23 18:57:02 发布

阅读量1.8k

点赞数 2

分类专栏：后端文章标签：大数据 java redis 分布式架构

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_67698950/article/details/125792705

版权

本文介绍了搭建一个通用监控告警平台的架构设计过程，包括平台与业务职责规划、用户场景诉求分析、选型与整体设计、关键点设计。平台采用了Prometheus为基础，解决了配置告警规则复杂、接入不便等问题，实现了分层、分组告警，并设计了告警通道对接。此外，还讨论了高可用性和部署运维策略。

摘要由CSDN通过智能技术生成

大家好，又见面了。

说到监控告警平台，大家应该都不会陌生，对于线上系统而言可以说是个标配，各个公司或项目也都会有搭建自己的监控告警平台的实际诉求。

当前比较主流的监控告警平台实现方案，很多都是基于Prometheus + Grafana + AlertManager来实现的。但是实际使用的时候会发现不易实施：

在运维部署对接方面存在一些不便，接入新的被监控节点时需要到平台部署机器上去修改配置文件、甚至重启服务来生效
配置告警规则等也是基于xml配置，必须要到平台服务器上去添加文件，对于一个各项目通用的平台而言，显然不可能将后端服务地址暴露让各业务负责人员去自行修改服务器上的配置文件
Grafana界面相对单一、可以用于看板或者大屏展示，但是一些公司内高度定制化的页面能力实现起来会比较麻烦（当然也可以基于Grafana二次开发定制），或者想在公司已有的运维平台中深度集成，实现难度较大。

前段时间研究了下基于Prometheus构建监控系统相关的概念，并以此为基准设计了一个企业级通用的监控告警平台的方案。这里分享一下架构的分析过程以及上述问题的解决思路。

平台与业务职责规划

既然是构建通用平台，就会涉及到平台与业务的职责划分的问题，这条线究竟按照什么尺度去画，究竟将平台做厚还是做薄，将直接决定了平台的整体定位：

平台做的太厚重，势必导致业务使用的约束增加、且定制化能力减弱，适用范围受限；
平台做的太轻薄，业务虽然有更多的主导权与定制灵活度，但也导致各个业务需要重复构建相关能力，平台将失去意义。

从构建通用平台的角度而言，很明显厚平台方案更具优势，可以统一整个公司各个业务的监控水平、可以持续的汇聚能力、积累沉淀。

所以，最终选择采用厚平台模式来构建：

集成数据存储、统计、告警策略、告警推送等能力，业务仅负责埋点数据上报即可。
告警能力扩展性强，全业务无差别共享
业务接入简单，但平台实现工作量较大
业务可以有限定制，但是需要基于管理界面上去配置规则，受平台规则支持度限制

最低0.47元/天解锁文章

倾听铃的声

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

倾听铃的声 CSDN认证博客专家 CSDN认证企业博客

码龄3年

771: 原创

17万+: 周排名

65万+: 总排名

61万+: 访问

: 等级

8916: 积分

419: 粉丝

503: 获赞

221: 评论

2397: 收藏

私信

关注

热门文章

分类专栏

后端 751篇
Java 64篇
前端 5篇
Java
MySQL
分类 1篇

最新评论

SpringCloud微服务项目搭建流程
飞羽疾驰: 可以的，我看的另一个SpringCloud项目视频，从零开发，五天学会了SpringCloud项目实战：https://knife.blog.csdn.net/article/details/134659054
tcp 为什么要三次握手，两次不行吗？为什么？
2401_82668611: 为啥重传syn报文要改isn？不改这样服务器不就可以区别是重传吗？
推荐 7 个牛哄哄 Spring Cloud 实战项目
天蓝999: 可以的，我看的另一个SpringCloud项目视频，从零开发，五天学会了SpringCloud项目实战：https://knife.blog.csdn.net/article/details/134659054
java常用数据结构有哪些
2301_79822942: 全是慢慢干货，作者好棒啊
大小厂必问 Java 后端面试题（含答案）
天蓝999: 可以的，我看的另一篇，我面试时90%以上的题目在下边这个博客里：https://knife.blog.csdn.net/article/details/121219272

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

倾听铃的声 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。