运维、监控、DevOps
文章平均质量分 73
运维操作,开发,监控配置、开发等
不识君的荒漠
apche rocketmq contributor、incubator-shenyu contributor,基础组件研发方向。
展开
-
CentOS8安装wireguard-dkms失败
centos8安装 wireguard-dkms失败解决方案原创 2023-08-08 22:23:59 · 905 阅读 · 0 评论 -
kafka-console-ui v1.0.6发布
kafka-console-ui 是一款web版的kafka管理平台,从第一次发布到现在已经两年了,断断续续也更新了7个版本了(v1.0.0~v1.0.6)。原创 2023-02-26 22:53:01 · 676 阅读 · 0 评论 -
kafka的客户端限流(资源配额)
本文说明的是Kafka的客户端(生产者、消费者)与broker之前的限流,不是kafka的broker间topic副本同步的限流。原创 2022-12-19 22:03:00 · 3340 阅读 · 0 评论 -
win10安装virtualbox及部署kafka踩坑记录
因为目前手里只有一台win10操作系统的笔记本,需要部署一套kafka环境进行调试,所以考虑使用virtualbox安装centos来部署kafka。windows下载安装virtualbox很简单,不清楚的可以从网上查询相关资料。centos是前两年下载的一个mini版本,考虑部署一个轻量级的服务器,所以用这个mini版本装一个虚拟机。virtualbox装centos虚拟机网络上有很多相关资料,也比较容易检索到,有需要的自行查询,不再重点说明。注意,我装的是一个mini版本默认是没有提供一个可视化界面的原创 2022-06-26 22:49:21 · 744 阅读 · 0 评论 -
Git在Windows下的安装
git提供了详细的中文官方文档,地址:Git - Bookgit在各种操作系统下进行安装的官方文档地址:Git - 安装 Git如果需要在Linux或Mac OS上进行安装,移步查看上面的官方介绍。windows下安装方法,官网上主要提供了3种:下面进行个说明:Chocolatey是一款windows下的软件包管理器,类似Linux的yum、apt等。国内网不好的同学不建议采用这个方案。如果有条件可以试一下,Chocolatey的安装也很简单:Chocolatey Software | Installing原创 2022-06-16 13:38:43 · 6965 阅读 · 1 评论 -
Grafana系列:在grafana7.x中配置一个如同Node Exporter中的table
前言用过node exporter的同学,可能用过这个监控面板:Node Exporter for Prometheus Dashboard CN 20201010资源总览下有个服务器资源总览表的面板:这是个table类型的面板。如果我想在自己的监控盘上也配置一个类似的table,比如监控rocketmq的消费端信息:我用的grafana版本是7.x,默认是没这个类型的,自带的table不是这个,这个是"table-old",如下:右下角,没有任何一个类型被选中。下.原创 2022-03-02 00:30:00 · 1712 阅读 · 2 评论 -
Grafana系列:如何去定义并配置更适合自己监控使用的变量
背景在Grafana配置监控面板的时候,支持配置变量应用在查询或者面板的title中,通过选择不同的变量,显示不同的查询结果。如下,便是定义的一些变量:原创 2022-02-26 21:49:00 · 8349 阅读 · 0 评论 -
Grafana系列:Gauge下面的Legend怎么不显示了
背景Grafana的Gauge像是车辆的仪表盘:官方介绍:Gauge | Grafana LabsGauge的Legend不显示正常情况下Gauge的legend会显示在仪表盘下面,如下:但是当我表配置好的dashboard导入其它监控里,发现下面的legend不显示了:我本来以为是与版本有关,换了其它版本后,发现还是这样,最终找到问题原因,不是大问题,如果该指标查询出来的数据只有一条就是这样,多于一条就正常显示了。尴尬,花了不少时间找原因。...原创 2022-02-25 23:30:00 · 2304 阅读 · 1 评论 -
Grafana系列:增加一个行面板
背景最近几天在优化一版监控面板,也总结不少经验,后续几篇会对其整理、分享。Grafana我自己也用了一年多,在博客里也分享了一些我自己配置的一些监控面板,但是配置上的细节,因为自己经验有限,还从没整理过,趁此机会,分享一些细节。关于Grafana的安装,建议参考官方:Installation | Grafana Labs一个可以折叠的行面板在一些监控面板上,可以看到这些:可以支一些面板进行分类,有一个title,然后展开或者折叠。如果面板比较多,这样还是挺有好处,可以把当前不原创 2022-02-24 23:45:00 · 5771 阅读 · 0 评论 -
一套拿来即用的RocketMQ监控面板和告警规则
背景在基于官方提供的rocketmq-exporter搭建监控的时候,官方有提供一个面板,地址:Rocketmq_dashboard dashboard for Grafana | Grafana Labs类似下面这个截图:但是看起来有点类似大盘的感觉,有时候指标太多,反而是没有指标。我重新整理了一个,提交到了github,地址:https://github.com/xxd763795151/rocketmq-monitor下面是监控和告警相关的配置说明。这套监控和告警的配.原创 2022-02-11 23:45:00 · 2541 阅读 · 1 评论 -
以rocketmq监控为例,在mac上安装prometheus及grafana
前言本文以在mac os上搭建一个rocketmq监控为例,说明如何安装及配置prometheus和grafana。其它类型的操作系统如Linux,可以参考相关安装步骤。监控拓扑以rocketmq的监控为例,部署的拓扑可能是这个样子:部署RocketMQrocketmq的部署不是重点,我本地启动了一个单节点,地址:localhost:9876。关于rocketmq的部署可以查看官方部署步骤:Quick Start - Apache RocketMQ部署rocketmq-e原创 2022-02-09 00:45:00 · 1216 阅读 · 0 评论 -
prometheus可视化方式配置告警分发到不同的钉钉群
prometheus进行钉钉告警的解决方案其实比较多,本文所用也只是其中一种,如果有同学刚好也是采用该方案,希望有所帮助。原创 2022-01-12 23:30:00 · 1403 阅读 · 3 评论 -
钉钉群机器人通知中的图片,突然不显示了
监控告警使用钉钉作通知,告警触发和告警解除的通知消息引了2张图片:本来运行的好好的,也运行这么久了,最近告警解除这个张图片突然不显示了:但是告警触发还正常:本来还以为是图片地址的问题,访问prometheus-webhook-dingtalk的ui地址调试看了下没问题呀:又换了多种方法没有解决,最后咋解决的呢:这个图片的地址是:https://is3-ssl.mzstatic.com/image/thumb/Purple18/v4/41/72/99/4172990...原创 2021-08-17 10:03:07 · 1980 阅读 · 3 评论 -
可直接拿来用的kafka+prometheus+grafana监控告警配置
kafka配置jmx_exporter点击:https://github.com/prometheus/jmx_exporter,选择下面的jar包下载:将下载好的这个agent jar包上传到kafka的broker节点所在服务器上,每个broker都需要,比如上传到如下路径:/opt/agent/jmx_prometheus_javaagent-0.16.1.jar修改kafka启动脚本: bin/kafka-run-class.sh,增加java agent配置如下:JMX原创 2021-08-15 22:48:26 · 9290 阅读 · 45 评论 -
一个拿来即用的钉钉告警模板
前言在prometheus配置告警分发到不同的钉钉群说明了将同一条告警分发到多个钉钉群的配置方式。下面提供一个我平常使用的一个钉钉告警的模板,模板最初的原型确实记不清从哪找到了,花了不少时间,后来我自己做一些适当调整,就成了现在主要使用的形式。钉钉告警组件使用的prometheus-webhook-dingtalk模板配置如果需要可视化自定义模板,可以在启动dingtalk的时候,设置参数:--web.enable-ui,如下:./prometheus-webhook-dingta原创 2021-04-09 09:46:47 · 2616 阅读 · 0 评论 -
prometheus配置告警分发到不同的钉钉群
场景假如我现在对一个MQ集群监控,设置告警,有如下两条规则: - alert: "RocketMQ,xxx_consumer出现消息积压" expr: sum by(group, topic) (rocketmq_group_diff{group="xxx_consumer",topic="xxx"}) > 1000 for: 1m labels: severity: busi annotations: description: '消原创 2021-04-01 23:55:16 · 1672 阅读 · 0 评论 -
zookeeper4字运维指令:is not executed because it is not in the whitelist问题解决
zookeeper4字运维指令:is not executed because it is not in the whitelist问题解决如果需要直接看解决办法的可以直接路过分析过程,看最后面,其实原因分析也很简单。1. 问题描述本来是想用wchc查看监听路径信息的,结果使用这个指令查询的时候,zookeeper服务器返回的响应信息是:wchc is not executed b...原创 2018-06-06 18:59:36 · 10411 阅读 · 5 评论 -
阿里云服务器(windows2016)部署问题与解决
看到阿里云有个活动我还能赶上,9.9/月一个最低级的云服务器,便买了玩玩,遇到不少问题,总结下。我这里有两个服务器要部署,一个是用C++写的基于windows平台的PC端的服务器,C/S通信用的是IOCP的网络模型,因为用的是winsock头文件,所以只能选中windows服务器。另一个是一个web系统,语言是java,分两层(core层和web层),web层通过dubbo调用core层服原创 2017-05-18 23:06:27 · 3358 阅读 · 0 评论