Prometheus监控方案搭建
文章平均质量分 74
Prometheus监控方案搭建讲解
奔波儿灞爱霸波尔奔
一个在安防行业摸爬滚打10年+的测试人
展开
-
Prometheus告警Alertmanager部署
资源监控一般离不开预警,因为我们不可能每时每刻都盯着某个资源监控看,而且在实际的工作中当中我们搭建的解决方案涉及到的服务器是多台甚至数十台,所以更加不现实,因此资源告警是一个必不可少的一个模块。原创 2024-06-19 11:28:39 · 854 阅读 · 0 评论 -
Prometheus常见exporter安装部署
在稳定性环境的监控当中需要收集各种各样的数据,这样的数据收集是通过各种exporter进行的,在这里我们进行最常用稳定性数据的收集exporter安装部署介绍。原创 2024-06-19 11:05:48 · 982 阅读 · 0 评论 -
Prometheus配置文件与核心功能
环境部署完成以后,我们就需要对产品进行稳定性监控。在知道怎么监控收集数据之前,我们需要知道prometheus的配置文件和核心功能首先我们从针对prometheus的全局文件进行说起,首先进入prometheus的存放的包的路径。以本文为例。进入以后,通过ls命令是可以看到一个prometheus.yml的文件然后打开配置文件,我们可以获取如下内容,重点内容注释详情如下红色标注部分,也可以参考官方文档中的配置文件说明:https://prometheus.io/docs/prometheus/lates原创 2024-06-18 19:00:02 · 628 阅读 · 0 评论 -
Grafana部署
5.启动完成以后,我们就可以用如下地址进行访问:http://XXX.XXX.XXX.XXX:3000/,默认的用户名密码为admin/admin,第一次输入以后需要你重新修改密码,修改成你说需要设定的密码。1.首先我们进入Grafana的官方网站的下载页面:https://grafana.com/grafana/download获取对应的版本。然后这里我们选择grafana-7.4.3-1.x86_64.rpm的版本进行点击进入下载,我们可以获取相应的安装包。3.通过以下命令对grafana进行安装。原创 2024-06-12 11:03:16 · 449 阅读 · 0 评论 -
Prometheus写入influxDB:中间件remote_storage_adapter
prometheus默认采用的是本地磁盘做数据存储,本地存储的优势就是运维简单但是缺点就是无法海量的metrics持久化和数据存在丢失的风险,数据写入可能造成wal文件损坏导致采集数据无法再写入的问题。为了解决单节点存储的限制,prometheus没有自己实现集群存储,而是提供了远程读写的接口,让用户自己选择合适的时序数据库来实现prometheus的扩展性。3.然后进入prometheus中prometheus.yml文件,使用vim进行编辑,添加如下内容。4.重启prometheus服务。原创 2024-06-12 10:53:52 · 511 阅读 · 0 评论 -
influxDB部署
如果在有外网的情况下是可以简化步骤1、步骤2中的步骤。只需要在在步骤1中获取下载的地址,然后进入CentOS操作系统下,使用如下命令即可获取安装包。然后这里我们选择influxDB中的V2.0.4版本进行点击进入,进入到对应的页面之后这里我们会看到针对不同操作系统的版本或者容器版本。我们这里下载的版本为:influxdb2-2.0.4.x86_64.rpm。https://portal.influxdata.com/downloads/获取相应的版本。这里我们设置成相应的参数如下。原创 2024-06-11 21:01:55 · 352 阅读 · 0 评论 -
Prometheus监控方案部署
在Prometheus中默认是的数据库是TSDB,它是一个时间序列数据库,主要存储监控数据,prometheus自带的一个数据,主要适用于小型的监控方案中。如果采集大量的服务器监控,则需要将数据库换成influxDB数据库。下面我们就针对Pometheus+influxDB+Grafana的监控方案进行部署。原创 2024-06-11 18:41:13 · 520 阅读 · 0 评论 -
Prometheus概述
Prometheus(普罗米修斯)是一个最初在SoundCloud上构建的监控系统。自2012年成为社区开源项目,拥有非常活跃的开发人员和用户社区。为强调开源及独立维护,Prometheus于2016年加入云原生云计算基金会(CNCF),成为继kubernetes之后的第二个托管项目。Prometheus存储的是时序数据,即按相同时序(相同名称和标签),以时间维度存储连续的数据的集合。原创 2024-06-07 14:38:42 · 1007 阅读 · 0 评论 -
聊一聊资源监控
当我们梳理完需要被监控产品/方案的监控指标以后,我们肯定要对每个监控指标设置一个阈值,当被监控的产品/方案某个监控指标达到或者超过阈值以后肯定需要进行相应的报警行为,因为我们不可能7*24小时的紧盯着我们的监控数值然后去发现问题。这个是不现实的。所以就要设定一定的报警阈值,只要产品/方案中某个被监控的指标超过阈值就进行报警。原创 2024-06-07 14:27:24 · 381 阅读 · 0 评论 -
聊一聊稳定性测试
关于稳定性测试,我们内部是这么定义的:被测试系统在特定硬件、软件、网络环境条件下,给系统加载一定业务压力,使系统运行一段较长时间,以此检测系统是否稳定,一般稳定性测试时间为 n*12 小时。原创 2024-06-07 14:13:13 · 427 阅读 · 0 评论