自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

cnsre运维博客

cnsre.cn SRE运维博客是一个专注运维方向的技术博客,是一个值得运维人员收藏的博客. * 本站涵盖系统运维、自动化运维、监控、脚本、容器

  • 博客(42)
  • 资源 (1)
  • 收藏
  • 关注

原创 欢迎大家关注我的个人博客 -- SRE运维博客

hello 大家好,我是SRE运维博客,欢迎大家关注我的个人博客。SRE运维博客 https://www.cnsre.cn作者:SRE运维博客博客地址: https://www.cnsre.cn/

2021-11-02 17:31:47 144

原创 AWS 中的另外一种远程工具 AWS Session Manager

因为项目的安全性。为了避免项目的服务器暴露在公网中。很多时候我们会使用跳板机或者是一些三方的远程工具,来进行一些安全性比较高的方式来进行远程项目的服务器,但是往往越安全的方式就越麻烦。那有没有一种既安全,有便捷的连接方式呢?当然有,今天就介绍下AWS Session Manager。{{< alert theme=“success” dir=“ltr” >}}x86_64ARM64在 CentOS 7.x 上安装 SSM Agentx86_64ARM64启动服务并设置为开机启动{{< aler

2023-05-11 12:28:58 556 1

原创 k3s 证书过期修改

去年双十一买的服务器,但是创建了 K3S 集群。今天登录的时候发现出现了以下错误。简单记录下。

2023-05-11 12:22:46 239

原创 使用 Lambda 函数将 CloudWatch Log 中的日志归档到 S3 桶中

躺了好久,诈尸了。因为换了工作,所以比较忙一直没有时间去更新博客的内容(主要还是因为懒🤔)话不多说 直接上干货。

2023-05-11 12:17:39 605

原创 eks使用efs dynamic provisioning 创建非root容器提示 Operation not permitted

作者:SRE运维博客博客地址:https://www.cnsre.cn/文章地址:https://www.cnsre.cn/posts/220125450139/相关话题:https://www.cnsre.cn/tags/eks/前言之前在 aws 中创建了 eks,在数据存储这一块中,我选择了使用 AWS 的 EFS 具体部署配置参考Amazon EKS 中 EFS 持久性存储。文章中的动态供给是 AWS 官方给的示例,使用的是root用户启动的容器。在我后面的测试中发现,我在使用非r..

2022-02-09 08:56:51 460

原创 Amazon EKS 中 EFS 持久性存储

作者:SRE运维博客博客地址:https://www.cnsre.cn/文章地址:https://www.cnsre.cn/posts/220110850573/相关话题:https://www.cnsre.cn/tags/eks/学习目标在 EKS 中部署 Amazon EFS CSI 驱动程序到验证 EFS 并验证它是否正常工作创建基于 EFS 的静态、动态存储前提条件EKS 集群AWS CLI 如果你没有安装请查看安装、更新和卸载 AWS CLI。在安装 AWS C..

2022-01-11 09:50:31 497

原创 如何彻底删除EKS中一直卡在Terminating的Namespace

作者:SRE运维博客博客地址:https://www.cnsre.cn/文章地址:https://www.cnsre.cn/posts/220107906441/相关话题:https://www.cnsre.cn/tags/eks/介绍最近一直在玩EKS(Elastic Kubernetes Service – Amazon EKS) 和 kubesphere。 因为之前没有使用过EKS 和 kubesphere 所以这个过程也是一个试错的过程,在我使用 kubesphere 的时候发现有..

2022-01-07 11:24:53 500

原创 AWS eks绑定alb 使用aws-load-balancer-controller(Ingress Controller)提供服务

作者:SRE运维博客博客地址:https://www.cnsre.cn/文章地址:https://www.cnsre.cn/posts/211217431135/相关话题:https://www.cnsre.cn/tags/aws/最近在AWS 平台创建了EKS 用于测试环境项目,EKS 创建完以后我打算使用 Ingress 控制器 来暴露服务,ingress 前在添加一个ALB 负载均衡器,这样就可以实现完全的高可用了。但是在创建好 ingress 却发现无法调通服务,查看 aws 官方文..

2021-12-17 16:22:38 1694

原创 Log4j 漏洞修复检测 附检测工具

作者:SRE运维博客博客地址:https://www.cnsre.cn/文章地址:https://www.cnsre.cn/posts/211213210004/相关话题:https://www.cnsre.cn/tags/Log4j/近日的Log4j2,可是非常的火啊,我也是加班加点把补丁给打上了次安心。Apache Log4j2存在远程代码执行漏洞,经验证,该漏洞允许攻击者在目标服务器上执行任意代码,可导致服务器被黑客控制。由于Apache Log4j 2应用较为广泛,建议使用该组件的用..

2021-12-13 12:40:45 19048 2

原创 AWS私有仓库ECR推送拉取镜像

- - -作者:SRE运维博客博客地址: https://www.cnsre.cn/文章地址:https://www.cnsre.cn/posts/211206944174/相关话题:https://www.cnsre.cn/tags/aws/- - -## 什么是 Amazon Elastic Container Registry(ECR)?Amazon Elastic&nbsp

2021-12-06 13:14:19 917

原创 AWS EKS 添加IAM用户角色

作者:SRE运维博客博客地址: https://www.cnsre.cn/文章地址:https://www.cnsre.cn/posts/211203931498/相关话题:https://www.cnsre.cn/tags/aws/因为创建 Amazon EKS 集群时,IAM 用户或角色会自动在集群的 RBAC 配置中被授予 system:masters 权限。例如,IAM 用户或角色可以是创建集群的联合身份用户。如果使用不属于 aws-auth ConfigMap 的 IAM 用..

2021-12-03 09:58:46 589

原创 多云搭建 K3S 集群

作者:SRE运维博客博客地址: https://www.cnsre.cn/文章地址:https://www.cnsre.cn/posts/211119132529/相关话题:https://www.cnsre.cn/tags/k3s/双十一薅了几个云厂商的羊毛,一开始搭建了k3s的单机版,后面就想着能不能搭建一个k3s集群,然后参考了这位大佬的文章,就试着用 WireGuard 来进行组网。它轻量、便捷、高效,而且数据全程加密传输,是依托公网组建虚拟局域网的优秀选择。环境介绍服务器介绍..

2021-11-19 12:59:39 1262

原创 快速搭建 kvm web 管理工具 WebVirtMgr

作者:SRE运维博客博客地址: https://www.cnsre.cn/文章地址:https://www.cnsre.cn/posts/211117937177/相关话题:https://www.cnsre.cn/tags/kvm/WebVirtMgr是近两年来发展较快,比较活跃,非常清新的一个KVM管理平台,提供对宿主机和虚机的统一管理,它有别于kvm自带的图形管理工具(virtual machine manager),让kvm管理变得更为可视化,对中小型kvm应用场景带来了更多方便。..

2021-11-17 10:32:56 883

原创 kvm简单使用

作者:SRE运维博客博客地址: https://www.cnsre.cn/文章地址:https://www.cnsre.cn/posts/211115903260/相关话题:https://www.cnsre.cn/tags/kvm/virsh命令常用参数参数参数说明基础操作list查看虚拟机列表,列出域start启动虚拟机,开始一个(以前定义的)非活跃的域shutdown关闭虚拟机,关闭一个域destroy(危险)强制关闭虚拟机,销毁..

2021-11-15 11:14:09 205

原创 k3s单机版安装部署 附一键安装脚本

作者:SRE运维博客博客地址: https://www.cnsre.cn/文章地址:https://www.cnsre.cn/posts/211109907029/相关话题:https://www.cnsre.cn/tags/k3s/双十一各大云厂商纷纷撒种子种韭菜(抢用户),良心云 也是一如既往的良心,新用户更是通过某宝 148 就可以买到三年 2C4G8M 的轻量应用服务器。于是我也出售薅了羊毛入手了一台。但是对于各种组件本身就对资源消耗比较大的 k8s 来说,跑起来还是有点费力的,于..

2021-11-10 11:18:21 1731

原创 kvm 安装 windows 虚拟机

作者:SRE运维博客博客地址: https://www.cnsre.cn/文章地址:https://www.cnsre.cn/posts/211108848062/相关话题:https://www.cnsre.cn/tags/kvm/安装前准备验证CPU是否支持KVM如果结果中有vmx(Intel)或svm(AMD)字样,就说明CPU的支持的。egrep '(vmx|svm)' /proc/cpuinfo关闭SELinux将/etc/sysconfig/selinux 中的 S..

2021-11-08 10:50:57 5507

原创 Centos7搭建 KVM 命令行安装虚拟机

文章目录**安装前准备**验证CPU是否支持KVM关闭SELinux安装一些最基本的服务安装KVM及其依赖项验证安装结果开启kvm服务查看状态操作结果配置网桥模式创建 ifcfg-br0 文件修改原网卡配置重启网络服务**安装虚拟机**准备操作系统安装镜像文件创建虚拟机文件存放的目录使用 virt-install 创建虚拟机**virt-clone克隆虚拟机**使用 virt-clone 克隆新的虚拟机作者:SRE运维博客博客地址: https://www.cnsre.cn/文章地址:https:

2021-11-05 15:27:53 1549

转载 zabbix 监控 aws rds 数据库

作者:SRE运维博客博客地址: https://www.cnsre.cn/文章地址:https://www.cnsre.cn/posts/211103006342/相关话题:https://www.cnsre.cn/tags/zabbix/环境准备zabbix-agent python2.7 pip 安装python 模块 pip2.7 install boto3 pip install awscli部署py脚本git地址 :https://github.co..

2021-11-03 11:12:20 461

原创 zabbix 通过 agent 监控进程、端口

作者:SRE运维博客博客地址: https://www.cnsre.cn文章地址:zabbix 通过 agent 监控进程、端口环境介绍操作系统:centos 7.4zabbix版本:zabbix server 3.4.7客户端:zabbix-agent 3.4.7监控进程:mysqld监控端口:3306 tcp进程监控确认客户端已经安装且运行agent查看进程查看属于那个用户的 几个进程mysql 的进程为root用户 两个进程添加监控项名称随便写类..

2021-10-25 09:40:44 451

原创 kube-eventer事件监控

文章链接下载deployment我这里保存成kube-event.yaml# cat kube-event.yaml---apiVersion: apps/v1kind: Deploymentmetadata: labels: name: kube-eventer name: kube-eventer namespace: kube-systemspec: replicas: 1 selector: matchLabels: app: kube

2021-10-09 11:32:01 616

原创 记一次 Ubuntu 内核升级故障处理

文章链接情况介绍负责的项目下有一批 ubuntu 18.04 的服务器在 AWS 上,因为安全的问题,需要把内核从 5.3.0 升级到 5.4.0。首次升级为测试环境测两台都是ubuntu 18.04 的版本 内核也都为5.3.0。第一台升级进展很顺利。软件更新,然后内核进行单独升级。等到需要重启的时候出现了问题。处理问题及解决思路问题1无法挂载磁盘首先遇到的第一个问题解决思路:升级内核导致 boot 空间越来越小,然后导致无法引导进入系统。因为之前遇到过boot空间占满的情况。但是那是

2021-09-29 13:38:10 846

原创 Kubernetes 持久化数据存储 StorageClass

文章链接PV 和 PVC 模式要先创建好 PV,然后再定义好 PVC 进行一对一的绑定。那么如果遇到大集群,也一一的创建吗?这样来说维护成本很高,工作量大。这个时候就有了 Kubernetes 提供一种自动创建 PV 的机制,叫 StorageClass ,它的作用就是创建 PV 的模板。StorageClass 会定义两部分:PV的属性:比如存储的大小、类型等PV需要使用到的存储插件比如Ceph等;有了这两部分信息,Kubernetes 就能够根据用户提交的 PVC ,找到对应的 Sto

2021-09-08 11:11:13 256

原创 kubernetes 使用 PV 和 PVC 管理数据存储

文章链接容器磁盘上的文件的生命周期是短暂的,这就使得在容器中运行重要应用时会出现一些问题。首先,当容器崩溃时,kubelet 会重启它,但是容器中的文件将丢失——容器以干净的状态(镜像最初的状态)重新启动。其次,在 Pod 中同时运行多个容器时,这些容器之间通常需要共享文件。所以我会用 NFS 为例,创建 PV 、PVC.PV 属于集群中的资源。PVC 是对这些资源的请求,也作为对资源的请求的检查。 PV 和 PVC 之间的相互作用遵循这样的生命周期.PersistentVolume(PV)Pers

2021-09-06 11:33:28 345

原创 kubernetes 安装 ingress controller

文章链接ingress-nginxingress 官方网站ingress 仓库地址ingress-nginx v1.0 最新版本 v1.0适用于 Kubernetes 版本 v1.19+ (包括 v1.19 )Kubernetes-v1.22+ 需要使用 ingress-nginx>=1.0,因为 networking.k8s.io/v1beta 已经移除直接部署 ingress-nginx直接部署比较简单,直接拉去 girhub 的文件就可以了,如果遇到长时间无响应,可以终止任务从新

2021-09-02 13:47:58 389 2

原创 LNMP 方式部署 zabbix 5.0

文章链接Zabbix 5.0 LTS新增功能新版本附带了可用性,安全性和完整性方面的重大改进列表。Zabbix团队遵循的主要策略是使Zabbix尽可能可用。Zabbix是一种开源,免费的监视解决方案,现在可以在内部和云中部署。在RedHat / IBM,SuSE,Ubuntu的最新版本的平台,容器和Linux发行版中可用。现在,一键式Zabbix部署也可以在Azure,AWS,Google Cloud,IBM / RedHat Cloud,Oracle和Digital Ocean上使用。现在,在Red

2021-08-24 15:05:39 341

原创 AWS EC2 实例 SSH 无法登录故障

文章链接故障表现在使用 jumperver 登录 AWS ec2 实例的时候发现 ssh 配合秘钥登录的时候无法登录,具体报错如下:ssh -i /path/xx.pem user@10.0.11.190 Permission denied (publickey,gssapi-keyex,gssapi-with-mic).问题排查过程在发现无法登录的第一时间等了AWS 平台查看底层监控是否正常查看到底层硬件工作正常,并没有观察到异常报错。通过查看业务服务,发现业务服务并没有收到影响。

2021-08-23 12:15:09 1738

原创 使用kubeadm安装kubernetes 1.21

文章原文配置要求至少2台 2核4G 的服务器本文档中,CPU必须为 x86架构CentOS 7.8 或 CentOS Stream 8安装后的软件版本为Kubernetes v1.21.xcalico 3.17.1nginx-ingress 1.9.1Containerd.io 1.4.3操作系统兼容性CentOS版本本文档是否兼容备注CentOS Stream 8????已验证CentOS 7.8????已验证CentOS 7

2021-06-10 15:12:00 209

原创 kubernetes使用jenkins Pipeline 部署Nginx

文章原文部署 nginx Deployment如果你已经完成了Kubernetes的搭建,那我跟我一块来部署第一个应用程序吧。没有完成 Kubernetes 集群搭建的,请参考文档 使用 kubeadm 安装 kubernetes 1.21创建 YAML 文件创建文件 nginx-deploy.yaml,内容如下:apiVersion: apps/v1 #与k8s集群版本有关,使用 kubectl api-versions 即可查看当前集群支持的版本kind: Deployment #该

2021-06-10 13:56:56 195

原创 kubernetes部署一个应用程序

文章原文部署 nginx Deployment如果你已经完成了Kubernetes的搭建,那我跟我一块来部署第一个应用程序吧。没有完成 Kubernetes 集群搭建的,请参考文档 使用 kubeadm 安装 kubernetes 1.21创建 YAML 文件创建文件 nginx-deploy.yaml,内容如下:apiVersion: apps/v1 #与k8s集群版本有关,使用 kubectl api-versions 即可查看当前集群支持的版本kind: Deployment #该

2021-06-10 13:47:30 154

原创 使用kubeadm安装kubernetes 1.21

文章原文配置要求至少2台 2核4G 的服务器本文档中,CPU必须为 x86架构CentOS 7.8 或 CentOS Stream 8安装后的软件版本为Kubernetes v1.21.xcalico 3.17.1nginx-ingress 1.9.1Containerd.io 1.4.3操作系统兼容性CentOS版本 |本文档是否兼容 |备注—-|—-|—-CentOS Stream 8 |????| 已验证CentOS 7.8 |????| 已验证CentO

2021-06-10 13:41:08 874

原创 安装和配置CloudWatchAgent

文章原文使用 CloudWatch 代理收集指标和日志下载 CloudWatch 代理软件包sudo yum install amazon-cloudwatch-agent点击查看其他平台软件包配置文件配置文件路径及名称 /opt/aws/amazon-cloudwatch-agent/etc/amazon-cloudwatch-agent.json#配置启动sudo /opt/aws/amazon-cloudwatch-agent/bin/amazon-cloudwatch-agent

2021-06-01 10:21:39 934

原创 ELK+kafka+filebeat搭建生产ELFK集群

ELK+kafka+filebeat搭建生产ELFK集群ELK 架构介绍集群服务版本服务版本java1.8.0_221elasticsearch7.10.1filebeat7.10.1kibana7.10.1logstash7.10.1cerebro0.9.2-1kafka2.12-2.3.0zookeeper3.5.6服务器环境说明IP地址主机名配置角色10.0.11.172elk-master

2021-05-24 16:06:55 1196

原创 zabbix告警推送至个人微信

文章原文自从接触zabbix后,就一直想着怎么才能把告警推送到个人微信上。有这样的想法主要是个人微信的使用频率远远要比钉钉,企业微信,邮箱,飞书等使用频率要高。比如我,就遇到过在周末的时候,因为没有及时登录钉钉查看zabbix告警通知,导致一些告警没来得及处理,对环境产生了影响。前段时间朋友给推荐了pushplus,一开始主要在jenkins做构建通知用的,后来就想,能不能使用zabbix的告警通知推送到微信上呢?先介绍下pushplus吧,pushplus 官方介绍pu...

2021-05-24 16:04:25 1825 1

原创 AWS EC2挂载多个磁盘

查看磁盘空间df -h查看可用的卷信息fdisk -l看到除了/ 磁盘的另外一块磁盘/dev/nvme1n1初始化新卷这个地方需要注意一下, 磁盘的格式, 比如 xfs有的是ext4 ext3mkfs -t xfs /dev/nvme1n1查看设备UUIDblkid开机自动挂载vim /etc/fstab挂载卷mount /dev/nvme1n1 /home/bsh文章原文https://cnsre.cn/posts/210315133616..

2021-05-19 09:10:09 510

原创 AWS修改EC2实例时间

解决aws ec2的centos7设置时区无效解决办法yum upgrade tzdata -y原因分析zdump -v /usr/share/zoneinfo/Asia/Shanghai我们会发现时区是固定不变的,无论我们通过修改 localtime 还是通过 timedatectl 修改,都无效.经过一番搜索,我发现是由于 tzdata 数据库老旧导致,升级即可解决.另外也可以通过 TZ 环境变量来设置,这是操作系统默认支持的方式.设置时区timedatectl set-timez

2021-05-19 09:09:11 593

原创 AWS使用快照创建实例启动失败

AWS使用快照创建实例启动失败问题描述 因业务需求,需要将A集群复制一份到B集群,当做预生产环境使用。但是在AWS使用快照的方式创建EC2实例的时候无法正常启动,通过获取AWS EC2截图能够看到已经到了登录界面。分析过程 在发现问题后尝试使用SSM登录,但是却无法登录进系统内部。后再停止实例运行,然后在运行实例,依然无法启动。为了排查是VPC的问题,还是实例镜像的问题。使用另外一台服务器的镜像启动,但是依然无效。最后在待实例进入 running 状态后,依次选择 Actions、Instanc

2021-05-19 09:07:36 376

原创 jenkins AWS CodeDeploy不停机部署

此项目的特点是把Jenkins与CodeDeploy相结合做的CICD做的蓝绿发布,CI与CD 是分开的,CI构建完以后以BuildNumber的形式把war包存至AWS的S3桶中。同时在java项目上把java代码与配置文件分离,这样的话我们就可以war包+ 配置文件的形式把项目发布至测试、预生产、生产等环境。在CD发布的过程中CodeDeploy中用到的是 CodeDeployDefault.OneAtATime 如果有一台发布以后健康检查失败,则停止发布另外一台,并吧该台设备从ALB 中剔除。jen

2021-05-19 09:04:47 441

原创 Zabbix 系统到底应该怎样优化?

本文链接https://cnsre.cn/posts/210303161655Zabbix架构在讲Zabbix优化之前,先来看看Zabbix Server 的逻辑架构图:对于上图中,架构组件的描述:Zabbix进程Self-Monitoring:用于收集Zabbix系统内部的监控信息;Configuration syncer:用于将配置文件中的配置信息同步到内存中缓存;Timer:用于处理触发器中与时间相关的函数和维护模式的进程;History syncer:用于写历史数据表的进程;

2021-05-19 09:03:45 334

转载 AWS使用快照创建实例启动失败

AWS使用快照创建实例启动失败问题描述 因业务需求,需要将A集群复制一份到B集群,当做预生产环境使用。但是在AWS使用快照的方式创建EC2实例的时候无法正常启动,通过获取AWS EC2截图能够看到已经到了登录界面。分析过程 在发现问题后尝试使用SSM登录,但是却无法登录进系统内部。后再停止实例运行,然后在运行实例,依然无法启动。为了排查是VPC的问题,还是实例镜像的问题。使用另外一台服务器的镜像启动,但是依然无效。最后在待实例进入 running 状态后,依次选择 Actions、Instanc

2021-05-17 15:18:47 262

转载 Jenkins AWS CodeDeploy不停机部署

此项目的特点是把Jenkins与CodeDeploy相结合做的CICD做的蓝绿发布,CI与CD 是分开的,CI构建完以后以BuildNumber的形式把war包存至AWS的S3桶中。同时在java项目上把java代码与配置文件分离,这样的话我们就可以war包+ 配置文件的形式把项目发布至测试、预生产、生产等环境。在CD发布的过程中CodeDeploy中用到的是 CodeDeployDefault.OneAtATime 如果有一台发布以后健康检查失败,则停止发布另外一台,并吧该台设备从ALB 中剔除。jen

2021-04-23 15:24:28 346

zbx_elk_status_templates.xml

zbx_elk_status_templates.xml

2021-11-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除