prometheus
文章平均质量分 88
云原生监控prometheus系列
lv2
10年+网络、运维、devops工作经验,CCIE、CKA、linux、系统集成等认证,寻求志同道合好友,共同学习进步~
展开
-
prometheus高可用之thanos
当前prometheus存在需求长期数据存储: >= 1个月的数据存储,存储空间大多 prometheus server :公有云/私有云/国内/国外多Grafan:多数据源解决思路联邦:优点是可从prometheus抓取指标,缺点是抓取多个指标时会存在问题prometheus remotewrite:用于可写远程存储配置。原创 2023-02-08 16:36:32 · 1591 阅读 · 0 评论 -
k8s 微服务spring boot JVM 监控
使用SpringBoot自带监控功能Actuator,可以帮助实现对程序内部运行情况监控,比如监控状况、Bean加载情况、环境变量、日志信息、线程信息、健康检查、审计、统计和HTTP追踪等。服务增加spring-boot-starter-actuator依赖 -> 启用 prometheus和health监控 -> 配置 prometheus 监控 -> 添加grafana dashboard。targets正常后,可以查询Jvm相关监控指标,如jvm_memory_used_bytes。原创 2023-01-11 12:01:47 · 3146 阅读 · 1 评论 -
玩转prometheus告警 alertmanger(三)之alertmanger定时静默
由于一些历史原因,存在一些特定场景,如凌晨3点至7点数据库同步时,会存在同步失败的告警,需要屏蔽此段时间的同步失败告警。alertmange可以通过静默(Sliences)实现告警屏蔽,但只能选择一段时间,无法实现重复在每天的指定时间段静默告警,那么,如何实现这个功能?原创 2022-10-11 11:41:36 · 1541 阅读 · 0 评论 -
玩转prometheus告警 alertmanger(三)之alertmanger告警持久化
由于alertmanager告警的记录不支持持久化记录,发送的告警信息不会存储在数据库中,prometheus将所有数据存储为时间序列,却不会将alertmanager发送的告警信息做为一条记录存储下来,因此,如何对alertmanager发送的告警信息进行持久化,并存储到数据库(mysql、pg)中?原创 2022-09-10 17:12:58 · 2365 阅读 · 1 评论 -
玩转prometheus告警 alertmanger(一)之prometheus告警规则
在开始之前,需要了解下prometheus和altermanger之间的关系是什么?从prometheus的架构及生态系统组件来看Prometheus从targets中抓取指标(metric)并存储,通过对指标进行分析生成告警(alert),并将告警(alert)推送(push)到Alertmanger,Alertmanger对告警进行分组、聚合等处理后,通过邮件、Slack、webhook等方式对用户进行发送告警信息。.........原创 2022-08-04 15:52:28 · 7991 阅读 · 4 评论 -
玩转prometheus告警 alertmanger(二)之alertmanger 邮件 钉钉告警
玩转prometheus告警 alertmanger(一)之prometheus告警规则_lv2的博客-CSDN博客官方文档altermanager告警部分,主要负责管理接收prometheus推送过来的告警,通过分组、静默、抑制、聚合等处理,将告警通过路由发送到对应的接收器上,按不同的规则发送给不同的模块负责人,支持邮件、salck及webhook(对接企业微信/钉钉/飞书)方式发送告警通知。......原创 2022-08-04 17:41:34 · 2901 阅读 · 0 评论 -
prometheus relabel_config 详解之保留__meta等内部标签
常见的场景使用中,如prometheus采集node_exporter的数据,在Targets中,可以看到 “job="xxxx"”等标签,以及以__meta开头的元组标签,有些标签可能需要重写标签,有些需要保留,如__meta是prometheus系统内部使用,无法被promql查询时使用的,这个时候就需要对__meta的标签进行重写保留。以双下划线__开头的标签属于特殊的标签,如__meta_开头的标签,它们在重新标记后会被删除。复制保留regex匹配source_label的值,并生成一个新标签。..原创 2022-08-09 18:33:05 · 804 阅读 · 0 评论 -
prometheus服务自动发现之阿里云ecs
当prometheus对各类exporter(如node_exporter、mysql_exporter等)进行监控指标采集时,可可以通过手动配置 static_configs,一个一个实例进行添加配置(不适于大规模主机等环境,太累了),也可以通过prometheus的自动发现(sd_config),如consul、eureka、zookeeper、kubernetes、aws等方式实现动态发现服务。为什么要用自动发现的功能呢?......原创 2022-08-12 11:26:48 · 967 阅读 · 0 评论 -
prometheus服务自动发现之aws ec2
由于公司海外用的是aws,在建设prometheus监控告警系统的时候,想通过prometheus 的配置实现自动发现ec2实例,在网上搜了一圈,实在没找到比较通俗易懂带实例的文章,所以打算自己写一个,希望能帮到有需要的人。...原创 2022-08-15 17:58:39 · 901 阅读 · 2 评论