自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

漠效的博客

单手康复中,缓慢更新

  • 博客(251)
  • 收藏
  • 关注

原创 Nginx日志有哪些常用的分析

前言本来只是想写一篇Nginx日志的常用统计分析命令填充一下线上文档,虽然有点用但是觉得光写命令,文档太水了于是就顺便总结一下,在nginx或web服务中,需要有哪些进行分析的内容以及为什么有这些需求ps:统计命令的原因 在于不是每个公司或web所在的服务器上都有配置elk或其他开源日志分析工具的,而且即使有工具有时也不能筛出自己想要的内容日志格式无论进行哪种日志的分析,首先要注意日志输出的格式,不要网上的拿来就直接用以nginx来说,默认情况下没有特殊需求的,日志的配置如下:

2022-05-25 16:55:09 230 1

原创 Jenkins怎么同时上线更多项目

前言如果是初学者或公司上线的项目少节奏慢时,大多数的工作人员都是部署和使用一个jenkins,满足要求即可。但是当你所在的公司有很多的上线服务(例如springboot等微服务架构的服务)或者很多的分站,短时间内要求进行大量上线,如果你要是还简单的使用一个jenkins,就会出现忙不过来的问题.同一台jenkins上进行的服务过多,还会导致服务器负载过高,拖慢上线速度或超时导致上线失败。于是,我们要想办法加大jenkins的并发工作。下面介绍一些很实用的操作,Jenkins怎么加快工作/发布效率?

2022-05-24 13:20:42 386

原创 Jenkins Pipeline实现持续集成

前言最近不知道写点,想着补充一下自己的以前的文档,有时间就补充一下jenkins,nginx。。。以前个人总结的jenkins文档:https://blog.csdn.net/gx_1_11_real/category_9186060.htmlJenkins官方文档:https://www.jenkins.io/zh/doc/book/pipeline/下面介绍一下Jenkins Pipeline的基本用法由于内容较多,为了讲解编辑了大量的补充性的内容,建议首次看的可以不看补充内容Pi

2022-04-23 22:01:47 1350 1

原创 怎么做一个文件/软件管理服务器

前言由于要使运维工作更加的规范,于是要对一些操作进行统一和调整例如一些软件的安装包(tar.gz zip rpm Centos镜像),对这些文件按版本进行整理,可以做一个类似镜像网站首先最低满足以下需求:<1>要对日常或工作中需要的软件的安装包的存放位置,上传下载方式进行统一,使其不在散乱上传通过个人jumpserver账号 下载通过wget<2>在不同的局域网或网络环境下,凡是可以访问公网的,都可以使用这边提供的域名或url进行下载,避免某些环境软件的时候还得

2022-04-14 22:05:40 3425

原创 Mysqld_exporter部署及常见的几种错误

前言由于近期某个同事部署这prometheus的监控mysql的组件的时候,出现了一个没见过的报错,刚好有时间就写一下。mysqld_exporter的部署数据库授权需要一个账号对数据库进行查询,所以必须去监控的数据库中授权用户和密码随意CREATE USER 'exporter'@'localhost' IDENTIFIED BY 'expoter12Ssdc3' WITH MAX_USER_CONNECTIONS 3; GRANT PROCESS, REPLICATION

2022-04-09 16:05:14 3619

原创 等保sudo权限配置

前言由于近期协助等保,研究了一下Centos的权限配置,又有一些新的理解,于是写一篇文档对之前的安全设置进行补充by:之前写一半的老存稿,没什么可修改的,先发再说。。su可进行任何身份的切换,常用的操作如下,其他参数实际并不常用 su - 代表使用 login-shell 的变量文件读取方式来登陆系统 如果没有加用户名,则代表切换为 root 的身份 如果没有加-,直接加用户名,则代表了读取的变量方式为 non-login shell

2022-02-28 19:47:11 1068

原创 关于Centos下修改root用户名导致sudo异常问题

前言为了增强的系统的安全性,有时候我们会增加一些安全配置,但是又时候有些配置真的没必要,并且比较危险。登陆过程输入账号密码后,系统会先在/etc/passwd文件内核对输入的账号,如果有就读取账号对应的UID、GID,家目录、shell设置然后查找/etc/shadow中对应账号、UID,并核对输入的密码正确则进入login shell,读取/etc/profile的配置,执行/.bash_profile、/.bashrc、/etc/bashrc由此可知,我们可以通过修改/etc

2022-02-21 16:47:20 1065

原创 MySQL密码正确却无法登录

前言有这么一种情况,你设置了一个账号,一个密码。目的是为了限制用户使用这个账号进行登录,查询指定库 或者 通过这个账号做一个主从。你很确认你的密码是什么,甚至是刚刚设置完,但是你始终无法通过这个密码进行登录。问题原因数据库是否正常启动是否指定ip,端口,socket对登录mysql的安全限制mysql授权问题(常见问题)解决方法<1>如果数据库正常启动,root等账号,是否可本地登录和远程登录本地都登录不进去,查看日志是否报错,可跳过密码进入数据库,

2021-11-15 16:43:28 4134

原创 (Cobbler)分区问题及解决2

前言第一篇https://blog.csdn.net/GX_1_11_real/article/details/103766100接着上一篇,下面介绍的是Cobbler的ks文件 在磁盘16T以上 时 分区及格式化异常的解决方法。【1】分区当我们的服务器的磁盘容量大于16TB时(例如:12个4T的硬盘,组raid5)由于ext4文件系统,默认32位只能支持16T,只有修改配置后启用64位模式,才能支持16T以上。因此在ks使用ext4时,Linux操作系统安装过程中,我们并不能对16T

2021-11-12 15:47:42 604

原创 Openresty新添加模块

前言前几天,前端提出了个需求,线上web服务器开启gzip模块。节约网站出口带宽,加快数据传输效率,提升用户体验。由于使用的Openresty和nginx还有点差别,下面记录一下过程。Openresty同nginx一样,增加模块需要重新编译Openresty添加模块<1>安装依赖包yum install -y gcc gcc-c++ zlib-devel pcre-devel openssl-devel readline-devel如果是在其他环境新部署一个open

2021-11-03 17:09:59 2550 3

原创 LDAP应用:OpenLDAP集成到Open***

有些字段不能出现,就省略了。可尝试访问下列链接https://blog.csdn.net/GX_1_11_real/article/details/120993422

2021-10-27 15:18:55 53

原创 LDAP应用:OpenLDAP集成到Jumpserver

前言由于最近处理了一个jumpserver问题,刚好想起填一下openldap的坑.Jumpserver是国内流行的开源堡垒机,被很多公司在使用.从2018年的0.5.0版,截至到现在已经出到2.14.2了,功能是越来越强大,部署和迁移也越来越便捷,并且它也提供了 LDAP 的用户认证方式.因此我们可以连接LDAP,使LDAP的用户,使用统一的账号和密码,登录Jumpserver Web页面和终端(COCO) 的用户认证,再使用Jumpserver 创建的系统用户,跳到目标主机系统用户是 J

2021-10-27 12:17:29 378

原创 Prometheus打开缓慢问题处理(Too many open files)

前言某天当prometheus添加到大致2500个指标(Targets)时,prometheus开始出现了打开缓慢,偶尔会挂掉的现象.于是进行了一些调优.在prometheus中一 单个进程打开文件句柄数过多ulimit中的nofile表示单进程可以打开的最大文件句柄数,可以通过ulimit -a查看,子进程默认继承父进程的限制(注意,是继承,不是共享,子进程和父进程打开的文件句柄数是单独算的)。网上还有一种解读是nofile表示单用户可以打开的文件句柄数,因为他们在limit.conf

2021-10-14 15:38:27 1108

原创 ansible-playbook推送时常见的几种错误以及解决方法(Linux)

前言由于要推送的目标服务器,系统的不统一和初始化环境的不统一,导致使用ansible-playbook推送的时候遇到了一些问题,于是对一些常见报错进行总结.目标服务器目录不存在报错如下:FAILED! => {"changed": false, "msg": "dest '/xxx/xxx/' must be an existing dir"上面的报错告知目标服务器不存在该目录,你需要去目标服务器去创建.通常出现此问题的原因为你要推送的目录不是服务器自带的,而是自行创建的,在

2021-09-27 17:32:36 2436

原创 Linux 启动时,出现give root password for maintenance处理方法

报错某天由于openstack资源不足,导致了宿主机杀死了上面的部分虚拟机.刚好杀死了nginx和监控各微服务存活的一个服务.导致了整个平台大部分对外服务的访问异常. 大部分服务由于配置了开机自启,重启虚拟机后就恢复了.没配置的只能手动起. 在重启某虚拟机的时候,出现了如下问题,提示GIVE root password for maintenance,输入密码并进入后,重启网卡或reboot仍退到此报错问题原因/etc/fstab文件挂载的分区异常或不正确关机及其他原因导致的分区受损常见

2021-09-24 16:45:28 3165

原创 K8s关于异常Pod的处理

前言某天开发人员开发环境发布失败,于是找到了这边处理一下.过程<1>发布环境是Centos系统的k8s测试集群,从jenkins上看编译正常,编译后镜像正常,结果在启动和注册时候一直不成功直到超时发布失败.<2>服务器上进行查看,发现pod状态为Pending(该状态通常是调度异常,通常是k8s 的node资源不足)kubectl get pod -n <namespace> |grep 项目名称kubectl get pod -n <nam

2021-09-13 16:55:43 765

原创 Error from server (BadRequest): a container name must be specified for pod

报错之前查看pod的日志使用 kubectl logs -f <POD-name> -n <nameSpace> 该命令可正常看到日志.某天使用该命令查看状态未runnning的pod,居然产生了报错.Error from server (BadRequest): a container name must be specified for pod xxx ,choose one of:[xxx xxx]报错原因及处理原因:本来一个pod使用了一个容器,当使

2021-09-04 15:40:57 9826

原创 Prometheus监控DELL服务器硬件

前言注意标题说的监控dell服务器硬件,指的是监控服务器硬件的状态(磁盘,内存,电源等的状态),不是指监控硬件性能,磁盘的空间,内存等的使用量.而是类似于zabbix监控idrac的snmp获取硬件状态.现在大部分公司是使用prometheus监控容器和服务,zabbix监控硬件,端口,当然还有其他监控架构.这里就不对比各个监控的优劣了.仅仅是做一篇文档.前提条件<1>各个需要监控的服务器开启idrac的snmp,并设置团体名,类似于密码(默认是public)注意自己设置的

2021-09-03 16:35:50 1578

原创 Docker 修改容器默认存储位置

前言通常情况下docker默认的数据存储目录是/var/lib/docker,这是相对危险的。当/空间本来就很小,使用docker使它将根下的空间用尽,然后导致服务问题。因此当使用kubernets或其他基于docker的服务时,需要修改容器默认的存储位置到磁盘空间分配较大的目录中.<1>查看docker当前root目录docker info |grep -i root<2>停止docker服务systemctl stop docker<3&g

2021-08-29 16:41:13 698 2

原创 Centos7配置Squid代理服务器(用户认证+限制对部分网站的访问)

前言由于要在某台内网服务器上做一个简易的爬虫,添加一些功能。但是该内网服务器使用的dns为专门配置的内网dns,且运行nginx做代理,不适宜调整dns,只能调整脚本,使执行脚本时通过代理的网络。于是查看了一下Squid文档,找一台配置了外网dns的虚拟机,搭建了一个简易的代理,满足了基本的使用需求。下面是记录的是配置Squid的文档。老草稿发出来算了。Squid介绍Squid是一个高性能的代理缓存服务器,Squid支持FTP、gopher和HTTP协议。当用户指定它为代理服务器,且用户的

2021-08-25 16:02:01 1369

原创 前端项目编译失败处理

前言突然想简单记录一下,前端项目npm编译失败/上线失败的处理方法。某天jenkins上线失败,前端反馈测试环境直接部署前端项目的时候,提示部署失败。Finished: UNSTABLE<1>开发提供了报错 { parser: “babylon” } is deprecated; we now treat it as { parser: "babel“} , 怀疑是此报错导致的编译异常。然而这个不是报错,是需要将babylon 换成babel即可找到modules包里面的:

2021-08-24 12:32:32 460

原创 mysql的源码安装(5.7.33版)

前言以前记录了5.5.32的源码安装,这个版本虽老但仍有大部分公司使用,稳定并且没需求一般不会升级。实际上5.6 5.7是现在比较常用的版本,如果要配置apollo等服务必须使用5.6及其以上版本。下面记录的是mysql的源码安装,及其排错。示例环境:centos7.6mysql版本:5.7.33【1】依赖包安装yum -y install perl perl-devel autoconf gcc gcc-c++ pcre pcre-devel openssl open

2021-08-19 11:53:25 721

原创 zabbix告警积压的处理

前言在某些时候,由于网络方面的故障(例如:交换机调整或某机房网络波动),会导致成百上千服务器报警,由于报警邮件发送频繁导致邮箱被禁,zabbix仍尝试多次发送,最后导致zabbix堆积大量告警队列,然后产生延时。当网络恢复后,并且联系邮箱管理员解除限制后,仍能不断的收到延迟的报警和恢复邮件。为了避免过时的报警,影响监控,我们需要把zabbix积压的消息处理掉,让它不再发送。方法一修改mysql的zabbix库alerts表,把状态改为已发送或发送失败<1>为了避免误操作,

2021-08-10 17:49:01 826

原创 error: You must be logged in to the server (Unauthorized)报错处理

报错k8serror: You must be logged in to the server (Unauthorized)https://blog.csdn.net/GX_1_11_real/article/details/114290457error: You must be logged in to the server (Unauthorized)

2021-08-05 18:00:20 1714

原创 LDAP应用:OpenLDAP集成到Jenkins

前言前段时间遇到个jenkins登录问题,正好填一下以前写openldap或jenkins留下的坑,介绍一下openldap集成到Jenkins的操作Jenkins ver. 2.176.2openldap 2.4.44Centos 7.2Openldap相关配置下方链接为Openldap搭建操作https://blog.csdn.net/GX_1_11_real/article/details/108577999Openldap重置密码由于使用个人环境忘记管理员

2021-07-03 18:31:48 322 5

原创 k8s高可用环境部署-补充(重置k8s)

前言这一篇是对部分内容的补充。如果你的k8s在第一次初始化的时候存在问题,如何重新初始k8s集群,需要清理哪些环境根据情况选择性修改,需在所有节点执行cat reset.sh #!/bin/bash#重置kubeadm reset#停止相关服务systemctl stop docker kubelet etcd#etcd的清理#清理docker环境(可不清理)#<1>删除所有docker容器docker rm -f $(sudo docker ps -

2021-05-31 18:14:07 254

原创 apt-get upgrade异常解决办法

问题使用ubuntu系统升级软件包时,出现了报错,原因 为依赖关系导致解决方法/var/lib/dpkg/info 用于保存各个软件包的配置文件列表,安装包时会从这里查找依赖如果误删该文件夹,不会造成系统瘫痪,但会对后续软件的安装造成影响<1>清理info目录 mv /var/lib/dpkg/info /var/lib/dpkg/info_bak<2>重新生成info.并修复损坏的软件包mkdir /var/lib/dpkg/i

2021-05-27 14:31:32 807

原创 k8s高可用环境部署7(Dashboard and metrics)

前言通过前面的文档,K8S集群部署成功了,接着我们就需要正式的去应用了。在正式上线服务之前,我们还需要部署一些服务,来实现对k8s的管理和监控。这一篇介绍的部署kubernetes-dashboard来实现k8s的可视化管理。部署dashboard<1>创建dashboard目录用于存放之后的密钥及文件mkdir /etc/dashboard-certs<2>下载ymlcd /etc/dashboard-certswget https://raw.

2021-05-20 17:18:50 214

原创 k8s高可用环境部署6(Flannel/Calico)

三、安装calico插件wget https://github.com/projectcalico/calico/releases/download/v2.6.12/release-v2.6.12.tgztar xf release-v2.6.12.tgzcd release-v2.6.12/k8s-manifests/hostedsed -i ‘s?http://127.0.0.1:2379?https://192.168.0.62:2379,https://192.168.0.63:2379,h

2021-05-20 00:27:20 375

原创 K8s解除非安全端口禁用

新版本的(1.16以后)kubernetes的apiserver只开启了安全端口6443的访问,默认禁用了非安全端口。如果使用了非6443,则需要处理一下,否则会报错,导致部署Pod异常。调整各节点以下yaml文件,去掉–port=0,并重启kubelet即可/etc/kubernetes/manifests/kube-scheduler.yaml/etc/kubernetes/manifests/kube-controller-manager.yamlsudo systemctl restart

2021-04-15 17:20:20 708

原创 关于Nexus3拉取不到jar包的问题处理

前言最近的编译的时候,出现了maven从Nexus3私服中,拉取不到jar包的情况,于是记录一下处理方法。原因及处理方法负载jenkins同时执行的Job过多,用于拉取和编译的服务器的负载过高解决方法:关于这个问题,建议编译服务器的性能高点,同时并行的任务数量不要一次跑太多dns导致网络异常导致编译服务器找不到私服地址如果是这个原因导致的,应该是所有jar包都拉不下来,不会出现仅部分或某个jar包无法拉取的现象。解决方法:去编译机ping一下,使用命令尝试拉取ja

2021-04-15 16:15:06 2221

原创 Nexus3忘记密码,如何登录

前言前几天nexus3拉取jar包出现了问题,想要登录排查却发现把密码忘了。于是,总结了一篇处理方法,部分说明当源码包解压后,解压出的nexus为应用目录./etc/nexus-default.properties 可配置端口./bin/nexus.vmoptions 可修改运行内存和工作目录./bin/nexus 为启动脚本(status/stop/start/restart)当启动后,如不调整工作目录,默认会在应用目录上一层创建工作目录sonat

2021-04-15 12:26:40 1324

原创 k8s高可用环境部署5(加入Master/Node)

前言前几篇已经部署好环境,接着就可用正式部署k8s了kubeadm初始化集群可使用命令直接初始化,也可使用配置文件当使用文件初始化时,需要确保配置的正确性1~2仅在master1上执行即可<1>创建kubeadm配置文件cat >kubeadm-config.yaml <<EOFapiVersion: kubeadm.k8s.io/v1beta2kind: ClusterConfigurationkubernetesVersion: v1.1

2021-04-07 18:54:11 547

原创 k8s高可用环境部署4(HA)

前言这一篇介绍的是配置k8s的高可用环境keepalived+Haproxy如果是实体服务器或VM虚拟机等建议使用这个方案。如果是阿里云等云服务器建议使用其官方的负载均衡方案。因为其与实体机的并不同,平台对网络环境限制较大。强行配置keepalive,有时反而不如其本身提供的负载方案。<1>keepalive部署在3台节点上执行,配置文件各节点都需修改部分参数,再启动yum install -y keepalivedcd /etc/keepalivedca

2021-04-07 16:36:27 300 1

原创 k8s高可用环境部署3(Etcd)

前言环境和部分软件已经配置好了,接着要部署一个Etcd集群。Etcd 通常是和master部署在一起,也有人会将 etcd独立于 k8s集群之外,以便于更好地扩展etcd集群。而此次是部署在3个master上。下面是关于Etcd的一些简单介绍:Etcd节点数:etcd 是基于raft算法的分布式键值数据库,在做决策时需要超半数节点的投票,所以 etcd集群 一般推荐奇数节点(3,5,7);etcd是高可用的,3节点etcd集群,最大容忍1台机器宕机。根据网上的资料还可以得出2个结论:设置偶数

2021-03-29 15:10:42 687

原创 k8s高可用环境部署2(Kubeadm编译)

虽然上一篇,已经yum安装了kubeadm。但是kubeadm如果直接拿来使用会存在一个问题,默认证书有效期为一年。因此需要在部署K8s前对kubeadm进行调整。链接地址如下:https://moxiao.blog.csdn.net/article/details/114290457...

2021-03-24 18:36:12 158

原创 k8s高可用环境部署1(系统初始化)

前言很多东西如果不做文档记录,以后通常会因为一些小问题,导致耽误时间。因此对Kubernetes的部分组件和部署进行基本的总结。环境初始化<3>以下,需在所有节点上执行<1>修改主机名(根据需求修改,分别修改。实际上要先做好规划,哪些服务器为master,哪些为node或其他服务,以下仅为示例)hostnamectl set-hostname k8s-master01hostnamectl set-hostname k8s-master02host

2021-03-24 18:27:28 163

原创 K8s集群node节点异常处理(Calico)

前言近期在测试环境k8s集群发现Calico的节点出现了异常,状态一直处于连接中,而且node节点的ip也出现了变化。于是对此次处理过程进行记录。这个异常不具备普遍性,因此文档仅供参考。发现在Calico 异常的node节点上,出现了大量的br开头的以及一些其他的虚拟网卡和虚拟ip. 应该是这些ip导致的。由于具体排查和处理需要大量的时间,为了不影响服务,先把异常节点下线。备注:可查看异常pod日志,再处理问题kubectl logs calico-node-f846j -

2021-03-19 17:23:53 3167

原创 Kubeadm修改证书时间

前言目前关于k8s的部署有着各种各样工具,其中不得不提到Kubeadm。虽然其因证书问题一直被人们所诟病,但它也是部署k8s最常用的工具。我们都知道使用kubeadm部署k8s在证书方面存在一个问题。证书有效期为一年,到期前必须续期。因此使用kubeadm部署的集群,在...

2021-03-11 15:00:15 739

原创 磁盘分区的扩容

只是想说一下基本的扩容问题。。为什么需要扩容?扩容简单的来说就是扩充容量。通常情况下,随着业务或需求的发展,原来分配的资源不满足现在的需求,对原本的资源进行扩充,使其能满足需求。例如:你以前买了个500G的移动硬盘,以为够用了。结果几年之后,你下的东西太多了,存储不下你的东西了,要么删除,要么扩充你的磁盘空间。扩容方法:<1>在云服务器上,通常只需要付费就可以很快的进行磁盘扩容,也可以新挂载 硬盘/nfs 等产品来达到扩充资源的目的。如果担心数据丢失,通常应该在扩容前做一个快照,出现

2021-01-27 12:11:14 601

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除