自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 prometheus+alertmanager告警消息对接企业微信、飞书、钉钉

本文讲述如何完美地将prometheus监控的告警消息通过alertmanager发送到企业微信、飞书、钉钉当前主流的通讯软件。

2024-01-30 23:14:57 2443 20

原创 内存去哪儿了——linux free 命令查看内存偏小

在分析这个问题之前,先来了解下kdump。kdump是Linux系统的一种高级故障处理机制,它可以在Linux系统内核崩溃时收集内存转储文件(crashdump),以便在分析转储文件时诊断问题。kdump可以帮助开发人员在内核崩溃时,更快地找到问题所在,以便更快地修复问题。

2023-04-09 18:37:32 2718

原创 由《羊了个羊》想到的高并发架构之路

由《羊了个羊》为话题切入点,结合自己的面试经历,详细讲解了高并发架构设计的演进过程!涉及到应用服务、数据库服务、缓存服务、负载均衡、ddos高防、WAF应用防火墙等多个知识点。

2022-09-22 23:55:00 1244

转载 查看操作系统版本的 N 种方式(Windows、CentOS、Ubuntu、Debian)

我们使用的各种软件,运行都离不开操作系统。大家都知道操作系统主要有Windows和Linux,如何查看当前操作系统的具体版本,你知道哪些方式呢?

2022-09-19 22:42:50 5637

原创 服务器无法登录之迷——login界面无限循环

1、/etc/security/limits.conf是linux资源使用配置文件,用来限制用户对系统资源的使用。limits.conf文件实际是linux PAM(插入式认证模块,Pluggable Authentication Modules)中pam_limits.so的配置文件,而且只针对于单个会话。2、/etc/security/limits.d/文件夹下定义的文件内容和limits.conf格式一样,但优先级更高,系统默认该目录下面是没有root.conf文件的。。...

2022-08-14 21:42:41 4283 1

原创 Grafana--监控数据展示神器

1. 前言    Grafana是一款用Go语言开发的开源数据可视化工具,可以做数据监控和数据统计,带有告警功能,可以分析指标和日志。使用Grafana可以制作出漂亮的仪表面板,它是一个炫酷的可视化监控、分析利器。无论我们的数据在哪里,或者数据所处的数据库是什么类型,都可以将它与Grafana精美地结合在一起。    本文将以Grafana7进行讲解,介绍其安装以及使用。2. 安装2.1 软件安装wget https:

2022-05-03 00:56:51 15697 4

原创 Prometheus之PromQL用法详解

前言    Promethues是目前一个比较流行的开源监控项目,被使用也越来越多。我们都知道Prometheus是通过时序数据库来保存数据的,那么Prometheus采集到数据后,是如何保存在自已的时序数据库中的呢?通常我们看到Prometheus的数据指标都类似这样:node_cpu_seconds_total{cpu=“0”,instance=“10.20.9.183:9101”,job=“node_exporter”,mode=“system”},可以看到它

2022-01-27 23:38:12 2338 2

原创 prometheus 添加 login 登录认证界面(nginx + flask 实现)

前言    prometheus是现在一个比较主流的监控软件,随着容器的普及,prometheus的应用越来越广泛,前面我也有专门讲到prometheus的相关文章。但是跟传统老牌的zabbix监控不一样,prometheus的web UI是没有登录认证的,有时候显得没有安全性,本文就主要讲解一下如何为prometheus添加一个登录认证界面。其实像elasticsearch、consul等一些服务的web UI也是没有登录认证的,都可以使用本文的方式进行实现。&

2021-11-07 11:51:03 6825 12

原创 计算文件md5的各种实现方式

最近在对接对象存储,为了确保上传到对象存储的文件没有被损坏,所以需要计算文件的md5值,以确保文件的完整性。现分享下目前工作中用到的各语言的md5的计算方式:linux shellmd5sum ./cheshi.txtwindows cmdcertutil.exe -hashfile .\ceshi.txt MD5pythonimport hashlibif __name__ == "__main__": with open("D:\\ceshi.txt", "rb") as

2021-10-18 22:01:23 773

原创 文件消失之谜——记一起linux文件被异常删除

国庆节之前,生产服务器上面的一些文件被异常删除,费了九牛二虎之力才找到删除原因,今天终于抽空在这里总结记录下事情的前因后果。文件异常删除9月27日突然接到 leader 的反馈,说业务团队没有收到当天的业务收据,让我检查对应的服务程序是不是异常。于是开始登录对应服务器,开始检查每日数据发送的脚本。结果一查看,服务器下面的/mnt下面的文件全部被删了,难怪说收不到当前的数据了。好在有备份的脚本,首先将备份拷贝过来,先运行起来。删除原因排查于是下面开始各种排查,三下五除二,一通分析排查。(1)首先

2021-10-16 19:37:21 4905 3

原创 GPU服务器的上手使用-小试牛刀

1. 前言深度学习、图像渲染、科学计算、挖矿这些复杂计算的场景都需要使用GPU进行大量计算,但是当你拿到一台GPU服务器以后,你应该如何入手学习呢,如何进行调试呢。本文主要讲解一些GPU相关的知识,从GPU简单介绍开始,进而到linux下如何查看GPU相关指标,最后讲解如何调试调用GPU,并使用GPU运行简单程序。注:本文讲解使用的GPU是NVIDIA GPU。2. GPU知识介绍2.1 GPU简单介绍GPU全称graphics processing unit,中文译名图形处理器,又称显示核心、视

2021-08-22 00:26:38 3254

原创 kubernetes高可用集群安装(二进制安装、v1.20.2版)

1. 前言之前文章安装 kubernetes 集群,都是使用 kubeadm 安装,然鹅很多公司也采用二进制方式搭建集群。这篇文章主要讲解,如何采用二进制包来搭建完整的高可用集群。相比使用 kubeadm 搭建,二进制搭建要繁琐很多,需要自己配置签名证书,每个组件都需要一步步配置安装。  本文以2021年1月14日官方更新的最新版 v1.20.2 来介绍。2. 环境准备2.1 机器规划IP地址机器名称机器配置操作系统机器角色安装软件172.10.1.11master1

2021-01-18 23:23:30 3905 16

原创 SSL证书介绍并使用openssl和cfssl生成SSL证书

1 SSL/TLS基本概念  SSL: Secure Socket Layer(安全套接层协议)的缩写,可以在Internet上提供秘密性传输。它是在上世纪90年代中期,由Netscape公司设计,目前已有3.0版本。为啥要发明 SSL 这个协议呢?因为原先互联网上使用的 HTTP 协议是明文的,内容是不加密的,这样就很可能在内容传播的时候被别人监听到,对于安全性要求较高的场合,必须要加密,https就是带加密的http协议。SSL协议的发明,就解决这些问题。目前SSL有1.0,2.0,3.0。&nbs

2020-12-06 21:10:18 2331

原创 Ubuntu 20.04美化及QQ、微信、ssh客户端安装

1.前言电脑用了很多年了,安装的windows7,经常出现很卡的情况,于是今天索性重装了系统。既然重装系统,选择什么系统好呢,windows10系统的话,对于我这老旧本来说,可能真的是为难它了。刚好ubuntu20发行没多久,于是尝试安装了ubuntu20.04。刚开始安装ubuntu20的时候,也是遇到了很多坑。在自定义分区的时候,一定要有boot、efi、biosgrub分区,否则安装完成后,会出现无法引导的情况。在这里我是折腾了好久,刚开始要么是没有给efi,要么是没有给biosgrub,导致都无

2020-12-06 12:00:54 866 2

原创 用python实现实时监控网卡流量(类似 top 动态刷新)

很多时候,我们是需要查看服务器的网卡当前跑了多大流量,但对于网卡流量的查询,在linux下似乎没有像top那样的原生命令。虽然top功能很强大,可以实时查看cpu、内存、进程的动态,但是却没有对网卡流量的监控。既然没有,那那就自己写一个吧,哈哈。本文代码综合使用了psutil和curses模块,脚本工具同时支持在linux和windows下使用,支持动态查看网卡流量。当然现在也有些第三方的工具可以使用,比如iftop。1.psutil模块psutil可以获取系统的很多信息,包括CPU,内存,磁盘,网络,

2020-12-04 15:35:24 3749 1

原创 运维监控之zabbix(5.0 LTS)

前言监控是每个公司必不可少的部门,通过监控我们能实时的观察设备的运行状态,保证业务稳定运行。当业务出现问题时,监控及时给各负责人发送告警,从而我们能够快速定位问题,及时止损。所以监控就像是眼睛一样,帮我们时刻盯着各个设备的工作情况。目前市面上有很多的监控软件,比如老牌的nagios、cacti、zabbix,新兴的prometheus、open-falcon、夜莺等,收费的监控宝、solar windows,每种监控软件都有自己的特点。至于怎么选择,就需要看你公司的具体情况,当然更多的是看你老大要你用哪个

2020-11-23 00:10:30 1285

原创 玩玩kubernetes dashboard可视化界面吧

1 前言管理kubernentes集群时,总是需要登陆机器命令行查看,难免有时候显得繁琐。那么有没有一种可视化的更方便管理kubernente的工具呢,这样更方便的全局查看整个集群的各种资源。目前用的比较多的是Kubernetes DashBoard和Rancher,其中Kubernentes-DashBoard是kubernentes官方提供的Web UI,Rancher是第三方开发的。当然也有很多公司会根据自己的实际需求,通过kubernentes提供的api接口开发适合自己的可视化管理界面。用户

2020-11-22 00:14:30 224

原创 python实现系统公网和私网流量监控

目前很多公司业务已经上云,使用了大量的云主机。当前大多数云厂商的云主机公网都是采用的eip,也就是内网和外网使用的同一张网卡,所以流量全部经过的同一个网卡。然而这就面临一个问题,如何将公网和私网的流量分开统计呢?特别是当机器流量异常的时候,如何快速的判断流量是来自公网还是私网。当然云厂商一般也提供了eip的监控,然而很多公司也有一套自己的监控,对于自建监控如何实现,这就值得思考了。本文将采用python实现云主机的公网和私网流量分开统计,可以将结果输入到自建监控中,当发生业务故障时,可以快速定位问题。1

2020-11-14 19:16:01 560

原创 kubeadm安装kubernetes(v1.18.8)

1. 前言kubernetes版本更新迭代非常快,上一篇写kubernetes搭建时,版本还是v1.15.0,现在已经更新到v1.18。看kubernetes在github的官方仓库,8月14日小版本已经到了v1.18.8。本篇文章基于kubeadm搭建kubernetes v1.18.8版。本篇文章与上篇文章几点不同之处:操作系统采用CentOS。master采用单节点,如果要搭建多master高可用集群可以参考上篇文章。解决无法访问kubernetes官方容器镜像仓库问题,上篇文章直接从ku

2020-08-22 23:16:40 1356 2

原创 监控之prometheus

1. Prometheus简介 Prometheus又称之为普罗米修斯,是一个最初在SoundCloud上构建的开源系统监视和警报工具包。自2012年成立以来,许多公司和组织都采用了Prometheus,该项目拥有一个非常活跃的开发人员和用户社区。它现在是一个独立的开源项目,可以独立于任何公司进行维护。Prometheus于2016年加入CNCF(云原生计算基金会),作为继kub...

2019-01-08 09:13:40 718

kibana-7.17.1的deb包

ELK日志系统组件之kibana

2023-04-03

logstash-7.17.1的deb包

ELK日志系统组件之logstash

2023-04-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除