#88 哆啦A梦—基于 Prometheus 的企业监控平台的设计与实现

#88 哆啦A梦—基于 Prometheus 的企业监控平台的设计与实现

这个主要讲的是 360 基于 Prometheus 开源的企业监控告警平台

https://www.bilibili.com/video/BV1Kv411B7hZ

360 搜索事业部云平台一直致力于将容器技术在生产环境中落地,已开源企业级 Kubernetes 管理平台Wayne,并经历了在生产环境大规模应用的考验。当下Prometheus 是被广泛应用的监控系统,既是容器时代的标配,也同时解决了应用指标监控的问题。然而它的报警模块 Alertmanager 还有一些地方不是很完善,使用起来不够灵活,针对这一问题,我们开发并开源了哆啦A梦报警平台 https://github.com/Qihoo360/doraemon

大纲

  • Prometheus 在 360 搜索云平台的应用
  • Alertmanager 的痛点以及哆啦A梦的设计思路
  • 哆啦A梦的功能介绍
  • 哆啦A梦的快速部署
  • 哆啦A梦报警聚合的实现
  • 哆啦A梦对 Prometheus 报警标签(Labels)的快速匹配算法

https://github.com/Qihoo360/doraemon/blob/master/docs/readme-CN.md

 

一、prometheus简介 Prometheus是一个开源的系统监控和告警系统,现在已经加入到CNCF基金会,成为继k8s之后第二个在CNCF维护管理的项目,在kubernetes容器管理系统中,通常会搭配prometheus进行监控,prometheus支持多种exporter采集数据,还支持通过pushgateway进行数据上报,Prometheus再性能上可支撑上万台规模的集群。 二、prometheus架构图 三、prometheus组件介绍 1.Prometheus Server: 用于收集和存储时间序列数据。 2.Client Library: 客户端库,检测应用程序代码,当Prometheus抓取实例的HTTP端点时,客户端库会将所有跟踪的metrics指标的当前状态发送到prometheus server端。 3.Exporters: prometheus支持多种exporter,通过exporter可以采集metrics数据,然后发送到prometheus server端 4.Alertmanager: 从 Prometheus server 端接收到 alerts 后,会进行去重,分组,并路由到相应的接收方,发出报警,常见的接收方式有:电子邮件,微信,钉钉, slack等。 5.Grafana:监控仪表盘 6.pushgateway: 各个目标主机可上报数据到pushgatewy,然后prometheus server统一从pushgateway拉取数据。 四、课程亮点 五、效果图展示 六、讲师简介 先超(lucky):高级运维工程师、资深DevOps工程师,在互联网上市公司拥有多年一线运维经验,主导过亿级pv项目的架构设计和运维工作 主要研究方向: 1.云计算方向:容器 (kubernetes、docker),虚拟化(kvm、Vmware vSphere),微服务(istio),PaaS(openshift),IaaS(openstack)等2.系统/运维方向:linux系统下的常用组件(nginx,tomcat,elasticsearch,zookeeper,kafka等),DevOps(Jenkins+gitlab+sonarqube+nexus+k8s),CI/CD,监控(zabbix、prometheus、falcon)等 七、课程大纲
©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页