自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

7*24小时的运维dog

时间总会有的,没有时间等于不重要。半世人生奔求之后,知自我人生之局限,知可为不可为,当为不当为

  • 博客(38)
  • 收藏
  • 关注

原创 K8S部署MySQL5.7的主从服务

【代码】K8S部署MySQL5.7的主从服务。附带gcr.io/google-samples/xtrabackup:1.0资源

2024-08-23 16:02:17 174

原创 Rancher2.8.5操作手册(持续更新)

选择需要创建Service的命名空间 ==》Service名称(使用Deployment名称-svc,例:test-svc) ==》输入端口名称,监听端口,目标端口(前端默认为80,后端默认为8080,目标端口,默认与监听端口一致) ==》点击“选择器” ==》键为:workload.user.cattle.io/workloadselector,值为:apps.deployment-项目空间名称-需要监听的Deployment名称。可以看到目前该集群的资源总额314,27个Deployment。

2024-08-22 16:22:29 667

原创 k8s部署redis一主两从三哨兵(集群内访问)

1、master节点删除后重启,查看master是否自动漂移。Pod被删除后会自动启动,且启动成功后会自动变为Slave节点。2.持久化数据选择用storageclass,动态创建pv存储,动态存储使用longhorn。1.基于K8s搭建部署1主2从3哨兵的Redis集群哨兵模式(集群内访问)四、查看节点集群状态 ,主从状态。创建redis配置文件。

2024-08-22 14:53:39 352

原创 JVM感知docker容器内存资源限制

我设置了 100MB 的容器内存,但JVM 设置了17.3G 的最大堆?它很可能会导致内核在某个时候杀死JVM程序在K8s中Deployments配置资源限制和预留的时候,比如设置最大内存为100M。但是宿主机的总内存为80G,这时候Pod启动后会超出内存限制,被Deployments杀掉。但为了维护设置的副本数量又创建新的,如此反复。原因是默认情况JVM默认最大堆空间为系统总内存的1/4,在容器中没有感知到集群为Pod设置的资源限制,而是按宿主机的内存算的,所以最终超过限制内存。

2024-08-19 15:31:05 1145

原创 k8s使用Deployment部署单机redis6.0

【代码】k8s部署redis6.0。

2024-08-16 18:23:32 177

原创 k8s使用Deployment部署单机mysql5.7

生产环境中应使用更可靠的存储解决方案。

2024-08-16 17:59:37 204

原创 使用容器启动的kubelet无法使用subPathExpr

验证subpathexpr功能 ,在pod 的yaml文件中,把pod name 以变量方式取出来,作为存储卷上的子目录来使用。这样在可以方便在一台服务器上运行多个相同的pod,且日志文件能够写入以各自pod名字创建的目录中,隔离了日志文件方便后续作为日志采集使用。虽然这种使用上不够合理,但作为一种过渡阶段的日志采集服务,也是能够接受。使用如下yaml文件创建一个pod,需要在运行pod的服务器的/data/目录下创建一个pod1的目录,并在里面写入hello.txt文件运行yaml文件。

2024-08-12 10:19:39 395

原创 k8s使用subpathexpr和hostpath分pod名字持久化日志

在k8s中,服务日志除了标准输出,还有写入日志文件,若要对这些日志文件进行持久化存储,无论是通过网络文件存储还是hostpath,都会面临一个问题,多个pod会往同一个存储目录的同一个文件进行写入,导致日志写入异常。解决方法:在存储上先以pod hostname 建个目录,再往里写日志,使用sidercar pod 或者修改启动脚本的方式,但是都不太便捷和浪费资源。从kubernetes 1.15版本后默认启用一个功能VolumeSubpathEnvExpansion。

2024-08-12 09:52:55 945

原创 RKE集群中部署OpenELB

2、RKE部署的K8s集群。1、非RKE部署的K8s集群:配置首先,需要为kube-proxy启动strictARP,以便Kubernetes集群中的所有网卡停止响应其他网卡的ARP请求,而由OpenELB来处理ARP请求。通过docker logs kube-proxy-container_id 查看配置生效 --proxy-mode="ipvs" 和--ipvs-strict-arp="true"将enable-keepalived-vip设置为true和enable-layer2=true保存更改。

2024-08-09 19:46:19 646

原创 Rancher的RKE和RKE2部署K8s集群kube-proxy开启strictARP

2、RKE部署的K8s集群。并将模板应用在已创建的集群中。1、非RKE部署的K8s集群:配置首先,需要为kube-proxy启动strictARP,以便Kubernetes集群中的所有网卡停止响应其他网卡的ARP请求,而由OpenELB来处理ARP请求。通过docker logs kube-proxy-container_id 查看配置生效 --proxy-mode="ipvs" 和--ipvs-strict-arp="true"kube-proxy配置strictARP=true。

2024-08-08 11:13:27 266

原创 Rancher问题集合

问题1:rancher运行需要配置pv、pvc的应用如下报错::kubelet, node1 MountVolume.NewMounter initialization failed for volume "local-pv-cadb07ab" : path "/hskj/data" does not exist。

2024-07-16 17:28:33 235

原创 LNMP方式安装ITop3.1.1

LNMP安装ITop3.1.1重难点配置

2024-07-15 17:35:10 127

原创 单机安装Rancher2.8.5

单机版本安装rancher

2024-07-08 19:57:53 1059

原创 OpenSSH的CVE-2024-6387漏洞修复

OpenSSH官方发布安全公告,披露在v8.5p1至9.8p1(不包括)的sshd存在一处因信号处理程序竞争问题导致的远程代码执行漏洞(CVE-2024-6387), 未经身份验证的攻击者利用漏洞可以在受害者 Linux 系统上以 root 身份执行任意代码。目前漏洞细节和PoC已公开,风险高。查看openssh版本。

2024-07-04 09:03:55 340

原创 Wazuh使用企业微信机器人预警

告警

2024-05-23 16:49:56 339

原创 cpu使用率

Linux 作为一个多任务操作系统,将每个CPU的时间划分为很短的时间片,再通过调度器轮流分配给各个任务使用,因此造成多任务同时运行的错觉。为了维护CPU时间,Linux通过事先定义的节拍率(内核中表示为 HZ),触发时间中断,并使用全局变量 Jiffies 记录了开机以来的节拍数。每发生一次时间中断,Jiffies 的值就加 1。节拍率 HZ 是内核的可配选项,可以设置为 100、250、1000 等。不同的系统可能设置不同数值,可以通过查询 /boot/config 内核选项来查看它的配置值。

2023-09-22 10:53:16 186

原创 zabbix监控ssd盘检查状态脚本

检查脚本结合和zabbix的自动发现。zabbix的配置文件。

2023-09-20 16:05:36 186

原创 Percona XtraBackup2.4.28中文文档+使用案例

本文档是Percona XtraBackup 2.4.28版本。使用案例:全量备份恢复和部分数据库和数据表备份恢复案例数据耗时分说明:数据操作耗时:ssd盘240G数据压缩后83G,约13分钟--提前做数据同步80G 的100M带宽 传输时间60分钟--提前做(可以使用rsync多线程)凌晨正式开始操作耗时:35分钟云平台的ssd盘full解压:20分钟--全量数据提前解压--可提前做full准备阶段:2分钟full导入阶段:37分钟

2023-09-15 16:15:13 529

原创 grafana告警发到企业微信带有图片

【代码】grafana告警发到企业微信带有图片。

2023-09-11 21:30:00 688

原创 arthas问题分析

【代码】arthas问题分析。

2023-09-11 21:00:00 81

原创 Zabbix中获取各用户告警媒介分钟级统计

键值:userEmailAlertCount["名字A邮件zabbix@qq.com"]:这里主要是key值的组成,这里的名字A是我们zabbix用户管理里面的别名(alias),zabbix@qq.com邮箱是我们在用户里面定义的邮件告警媒介。获取Zabbix各用户告警媒介分钟级统计,形成趋势图,便于观察各用户在每分钟收到的告警数量,在后续处理中,可以根据用户在某时间段内(例如3分钟内)收到的邮件总数,来判断是否有告警洪水的现象,以便于我们及时对相关现象做出处理。print "传入错误的告警媒介参数"

2023-09-08 15:59:27 131

原创 关于kafka生产者相关监控指标的理解

ProducerRequestRateAndTimeMs 50thPercentile :生产者请求速率耗时(50%)ProducerRequestRateAndTimeMs 75thPercentile :生产者请求速率耗时(75%)ProducerRequestRateAndTimeMs 95thPercentile :生产者请求速率耗时(95%)ProducerRequestRateAndTimeMs MeanRate:生产者平均请求速率。关于生产者相关的监控指标含义的理解,希望大神帮忙进行确定下。

2023-09-08 15:58:49 150

原创 jenkins+svn自动发布和回滚

简单说就是利用参数化构建,建立choice,choice里面建立两个变量,一个是发布新版,一个是回滚旧版。整体配置实现思路是通过参数,将每次构建的版本号传递过去,在客户机本地创建相关相关备份目录。备份相关目录文件即可。目前只能实现使用salt来管控配置文件的管控,配置文件的版本回滚需要后续定制化开发,或者进行格外其他的管理操作。在最后一次成功的构建结果处,可以获取到最新版本的构建文件。如果要回滚版本,可以写个脚本文件覆盖发布路径下的文件即可。30是版本号,jenkins上构建的版本号。

2023-09-08 15:57:59 164

原创 阿里云ECS内部机器端口被100.117.90段的ip疯狂扫描导致业务异常

后续定位是以前配置过的SLB在搞鬼,去除相关失效的SLB配置即可。提交工单,寻找阿里服务。

2023-09-08 15:57:04 70

原创 VMware中虚拟机克隆后多台主机网络冲突

在Vmware中将虚拟机的一台centos7机器克隆了3台,然后启动机器后出现机器都能够上网,但是无法在本地xshell中同时进行连接,且连接的某一台虚拟机都会经常中断。4、删掉设备管理器下的70-persistent-net.rules文件,此文件删除重启后会自动生成.3、在ifcfg-eno16777736文件中核实位置加入该mac地址。1) 打开虚拟机设置,找到网络适配器,选择高级选项。6、附录centos7.6中网卡配置文件。2、复制该mac地址。

2023-09-08 15:55:55 318

原创 pidstat命令

pidstat是sysstat工具的一个命令,用于监控全部或指定进程的cpu、内存、线程、设备IO等系统资源的占用情况。pidstat首次运行时显示自系统启动开始的各项统计信息,之后运行pidstat将显示自上次运行该命令以后的统计信息。用户可以通过指定统计的次数和时间来获得所需的统计信息。

2023-09-08 14:13:47 49

原创 CPU上下文切换(下)

Linux 调度的基本单位实际上是线程,而我们的场景 sysbench 模拟的也是线程的调度问题,那么,是不是 pidstat 忽略了线程的数据呢?通过前面学习我们知道,过多的上下文切换,会把 CPU 时间消耗在寄存器、内核栈以及虚拟内存等数据的保存和恢复上,缩短进程真正运行的时间,成了系统性能大幅下降的一个 元凶。综合这几个指标可以知道,系统的就绪队列过长,也就是正在运行和等待 CPU 的进程数过多,导致了大量的上下文切换,而上下文切换又导致了系统 CPU 的占用率升高。

2023-09-08 11:51:05 46

原创 CPU上下文切换(上)

Linux 为每个 CPU 都维护了一个就绪队列,将活跃进程(即正在运行和正在等待CPU 的进程)按照优先级和等待 CPU 的时间排序,然后选择最需要 CPU 的进程,也就是优先级最高和等待 CPU 时间最长的进程来运行。CPU上下文切换,就是先把前一个任务的CPU上下文(也就是 CPU寄存器和程序计数器)保存起来,然后加载新任务的上下文到这些寄存器和程序计数器,最后再跳转到程序计数器所指的新位置, 运行新任务。进程在用户空间运行时,被称为进程的用户态,而陷入内核空间的时候,被称为进程的内核态。

2023-09-08 11:02:49 69

原创 运维不背锅

拒绝任何单点主机、业务应用和数据库,拒绝无法使用idrac登录的物理主机。注意:不要使用yum的删除功能删除软件,会删除相关依赖,导致意外问题。所有的变更操作都要进行任务记录授权,不操作口头形式的操作要求。salt批量操作的命令需要进行授权管理,需要审核,登记,批复。最好的学习方式,就是坚持,专一。服务:7*24小时不中断。

2023-09-08 10:05:58 37

原创 阿里云ECS发送邮件到腾讯企业邮箱(ECS默认不开启25端口)

certutil -A -n "GeoTrust SSL CA - G3" -t "Pu,Pu,Pu" -d ./ -i qq.crt #认证。#将邮件的name转换成utf-8格式,addr如果是unicode,则转换utf-8输出,否则直接输出addr。set smtp=smtps://smtp.exmail.qq.com:465 #邮箱服务器地址。set nss-config-dir=/etc/pki/nssdb/ #证书位置。直接使用py脚本发送邮件,使用ssl的465端口,简单快捷。

2023-09-08 09:59:56 192

原创 Jenkins的安装与简单配置

Jenkins 插件管理器允许安装新的插件,和更新Jenkins服务器上的插件。从Jenkins现有的功能扩展或开发者们为Jenkins提供的新功能都可以称之为Jenkins插件。写在配置前的一些话:Jenkins的配置不可能全部都说到的,大部分配置是有中文说明的,部分配置是英文说明,点击输入框后面的问号就可以看见了。由上图可知,Jenkins默认集成了maven2插件,并且一旦插件有新版本,会提示更新新版本插件。,输入提示的管理员密码,进入到配置页面,会卡顿一段时间,具体时间的长短由机器的性能决定。

2023-09-08 09:58:00 1743

原创 Jenkins中管道案例脚本(声明式语法)

manager.addShortText("服务:"+manager.envVars['deploy_service'])manager.addShortText("分支:"+manager.envVars['deploy_branch'])description: '选择要发布的服务,默认是controller',description: '选择要发布的分支,默认是feature',

2023-09-08 09:56:36 78

原创 Dell服务器idrac9内网登录正常公网端口映射访问异常

默认情况下,iDRAC9 将检查 HTTP/HTTPS 主机标头,并与定义的“DNSRacName”和“DNSDomainName”进行比较。当值不匹配时,iDRAC 将拒绝 HTTP/HTTPS 连接。The webserver in iDRAC9 firmware version 5.10.00.00 enforces an HTTP / HTTPS Host Header check by default ,应该是这个版本启动了Host Header check。

2023-09-08 09:54:55 1233 1

原创 mysql数据库磁盘扩容操作步骤及其问题小坑

3、正式操作前关闭数据库服务,增量同步/hskj目录下的数据到/opt目录,卸载旧数据盘,挂载新数据盘到/hskj,启动mysql服务。1、完成磁盘raid1操作,将新磁盘挂载到物理机上并添加到kvm的存储空间中,创建好对应的数据盘,将数据盘挂载到数据库虚机的服务器上。需要安排时间对其进行操作扩容。2、将数据盘挂载数据库服务器上/opt目录,增量同步/hskj目录下的数据到/opt目录。4、卸载/hskj目录,将/opt的数据盘挂载到/hskj目录。1、格式化新挂载的数据盘,将数据盘挂载到/opt目录下。

2023-09-08 09:52:51 544

原创 1、平均负载和cpu利用率的理解

每次发现系统变慢时,通常做的第一件事,就是执行 top 或者 uptime 命令,来了解系统的负载情况。比如像下面这样,在命令行里输入了 uptime 命令,系统也随即给出了结果。最后三个数字含义依次则是过去 1 分钟、5 分钟、15 分钟的平均负载(Load Average)。平均负载?有人会说,平均负载不就是单位时间内的 CPU 使用率吗?上面的 11.9,就代表CPU 使用率是 1190%。其实并不是这样,可以通过执行 man uptime 命令,来了解平均负载的详细解释。

2023-09-07 13:38:53 208

原创 将邮件内容转为企业微信预警通知脚本

【代码】邮件内容转为企业微信预警脚本。

2023-09-06 11:01:25 156

原创 linux_perf_tools_full

图是 Linux 性能分析最重要的参考资料之一,它告诉你,在 Linux 不同子系统出现性能问题后,应该用什么样的工具来观测和分析。想要学习好性能分析和优化,建立整体系统性能的全局观是最核心的话题。

2023-09-05 17:21:45 52

原创 Jenkins的安装与简单配置

Jenkins安装1、安装Jenkins之前先部署安装java环境(java环境安装另外参考安装文档)注意:Jenkins需要运行Java5以及以上的版本。安装环境:CentOS7.3+Java8+Jennkins2.1.73):2、Jenkins的rpm包安装:wget https://prodjenkinsreleases.blob.core.windows.n...

2019-04-21 18:39:12 227

xtrabackup:1.0

gcr.io/google-samples/xtrabackup:1.0

2024-08-23

LNMP方式安装ITop3.1.1

1

2024-07-15

单机安装Rancher2.8.5依赖镜像包

单机安装Rancher2.8.5依赖镜像包

2024-07-08

OpenSSH的CVE-2024-6387漏洞修复软件包

rpm包

2024-07-04

percona XtraBackup2.4.28

本文档是Percona XtraBackup 2.4.28版本 Percona XtraBackup是一个针对基于MySQL的服务的开源热备份实用程序,它在备份期间不会锁定 数据库。可以备份MySQL 5.1、5.5、5.6和5.7服务器上的InnoDB、XtraDB和MyISAM表上的数据, 以及具有XtraDB的Percona服务数据. 注意:在Percona XtraBackup 2.1版本中,已经删除了对InnoDB 5.1内置程序的支持 无论是24x7高负载服务还是低事务量提交的环境,Percona XtraBackup备份是一个无缝过程,不对生 产环境中服务器的性能产生影响。 重要:Percona XtraBackup2.4不支持对在MySQL 8.0、MySQL 8.0的性能服务器或Percona XtraDB 集群8.0中创建的数据库进行备份。对8.0版本的数据库使用Percona XtraBackup 8.0。

2023-09-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除