![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Prometheus监控实践
文章平均质量分 94
如序
问渠那得清如许,绝知此事要躬行。
展开
-
5. 服务发现
当主机较少时,在抓取配置中手动列出它们的IP地址和端口是常见的做法,但不适用于较大规模的集群。尤其不适用使用容器和基于云的实例的动态集群,这些实例经常会变化、创建或销毁的情况。Prometheus通过使用服务发现解决了这个问题:通过自动化的机制来检测、分类和识别新的和变更的目标。原创 2023-08-10 21:59:17 · 1517 阅读 · 0 评论 -
4 Promethues监控主机和容器
目录1. 监控节点1.1 安装Node exporter解压包 拷贝至目标目录查看版本 1.2 配置Node exporter 1.3 配置textfile收集器 1.4 启动systemd收集器1.5 基于Docker节点启动node_exporter1.6 抓取Node Exporter 1.7 过滤收集器 2. 监控Docker容器2.1 运行cAdvisor 2.2 抓取cAdvisor 2.3 Node Exporter和cAdvisor指标 2.3.1 USE方法CPU利用率计算每种CPU模式原创 2023-08-02 22:44:17 · 1205 阅读 · 1 评论 -
3 Prometheus安装
在默认配置中,alerting部分包含服务器的警报配置,其中alertmanagers块会列出Prometheus服务器使用的每个Alertmanager,static_configs块表示我们要手动指定在targets数组中配置的Alertmanager。Prometheus的性能很大程度取决于配置、所收集的时间序列数量以及服务器上规则的复杂性,单位时间内采集的数据越多占用的内存就越多,对CPU消耗也大。如用到的标签、建立连接所需的身份验证,或者其他定义数据抓取的信息。若干目标构成的组称为。原创 2023-07-11 22:53:14 · 735 阅读 · 0 评论 -
2 Prometheus 简介
如http_response_error_total是总的指标,通过服务所在Region作为标签可以查询到亚太、美东、欧洲等区域的http_response_error_total指标。Prometheus可以单节点部署,也可以高可用(HA模式)部署,使用两个或者多个配置相同的Prometheus服务器来收集时间序列数据,并且所有生成的警报都由可消除重复警报的高可用Alertmanager集群来处理。允许基于现有的数据创建出新的时间序列数据,如根据请求数和失败数计算失败率,或者产生类似求和等聚合。原创 2023-06-29 23:12:11 · 760 阅读 · 0 评论 -
1 Prometheus-监控简介
通常从技术角度来看,监控是衡量和管理技术系统的工具和流程。但实际上,监控价值不止如此,它可以将系统和应用程序生成的指标转换成对应的业务价值。监控系统会将这些指标转换为衡量用户体验的依据,为业务提供反馈,确保为客户提供了所需的产品。监控不仅提供业务反馈,也提供对技术的反馈,指出哪些组件不起作用或者导致服务质量下降。技术业务全局视角,从最高层(业务)依次展开。协助故障诊断。作为基础设施、应用程序开发和业务人员的信息源内置于应用程序的设计、开发和部署的生命周期中。原创 2023-06-28 22:14:35 · 927 阅读 · 0 评论