自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

漠效的博客

随笔而已,偶尔开新坑,填坑随缘~~~

  • 博客(229)
  • 论坛 (1)
  • 收藏
  • 关注

原创 k8s高可用环境部署-补充(重置k8s)

前言这一篇是对部分内容的补充。如果你的k8s在第一次初始化的时候存在问题,如何重新初始k8s集群,需要清理哪些环境根据情况选择性修改,需在所有节点执行cat reset.sh #!/bin/bash#重置kubeadm reset#停止相关服务systemctl stop docker kubelet etcd#etcd的清理#清理docker环境(可不清理)#<1>删除所有docker容器docker rm -f $(sudo docker ps -

2021-05-31 18:14:07 16

原创 apt-get upgrade异常解决办法

问题使用ubuntu系统升级软件包时,出现了报错,原因 为依赖关系导致解决方法/var/lib/dpkg/info 用于保存各个软件包的配置文件列表,安装包时会从这里查找依赖如果误删该文件夹,不会造成系统瘫痪,但会对后续软件的安装造成影响<1>清理info目录 mv /var/lib/dpkg/info /var/lib/dpkg/info_bak<2>重新生成info.并修复损坏的软件包mkdir /var/lib/dpkg/i

2021-05-27 14:31:32 24

原创 k8s高可用环境部署7(Dashboard and metrics)

前言通过前面的文档,K8S集群部署成功了,接着我们就需要正式的去应用了。在正式上线服务之前,我们还需要部署一些服务,来实现对k8s的管理和监控。这一篇介绍的部署kubernetes-dashboard来实现k8s的可视化管理。部署dashboard<1>创建dashboard目录用于存放之后的密钥及文件mkdir /etc/dashboard-certs<2>下载ymlcd /etc/dashboard-certswget https://raw.

2021-05-20 17:18:50 27

原创 k8s高可用环境部署6(Flannel/Calico)

三、安装calico插件wget https://github.com/projectcalico/calico/releases/download/v2.6.12/release-v2.6.12.tgztar xf release-v2.6.12.tgzcd release-v2.6.12/k8s-manifests/hostedsed -i ‘s?http://127.0.0.1:2379?https://192.168.0.62:2379,https://192.168.0.63:2379,h

2021-05-20 00:27:20 45

原创 K8s解除非安全端口禁用

新版本的(1.16以后)kubernetes的apiserver只开启了安全端口6443的访问,默认禁用了非安全端口。如果使用了非6443,则需要处理一下,否则会报错,导致部署Pod异常。调整各节点以下yaml文件,去掉–port=0,并重启kubelet即可/etc/kubernetes/manifests/kube-scheduler.yaml/etc/kubernetes/manifests/kube-controller-manager.yamlsudo systemctl restart

2021-04-15 17:20:20 90

原创 关于Nexus3拉取不到jar包的问题处理

前言最近的编译的时候,出现了maven从Nexus3私服中,拉取不到jar包的情况,于是记录一下处理方法。原因及处理方法负载jenkins同时执行的Job过多,用于拉取和编译的服务器的负载过高解决方法:关于这个问题,建议编译服务器的性能高点,同时并行的任务数量不要一次跑太多dns导致网络异常导致编译服务器找不到私服地址如果是这个原因导致的,应该是所有jar包都拉不下来,不会出现仅部分或某个jar包无法拉取的现象。解决方法:去编译机ping一下,使用命令尝试拉取ja

2021-04-15 16:15:06 171

原创 Nexus3忘记密码,如何登录

前言前几天nexus3拉取jar包出现了问题,想要登录排查却发现把密码忘了。于是,总结了一篇处理方法,部分说明当源码包解压后,解压出的nexus为应用目录./etc/nexus-default.properties 可配置端口./bin/nexus.vmoptions 可修改运行内存和工作目录./bin/nexus 为启动脚本(status/stop/start/restart)当启动后,如不调整工作目录,默认会在应用目录上一层创建工作目录sonat

2021-04-15 12:26:40 129

原创 k8s高可用环境部署5(加入Master/Node)

前言前几篇已经部署好环境,接着就可用正式部署k8s了kubeadm初始化集群可使用命令直接初始化,也可使用配置文件当使用文件初始化时,需要确保配置的正确性1~2仅在master1上执行即可<1>创建kubeadm配置文件cat >kubeadm-config.yaml <<EOFapiVersion: kubeadm.k8s.io/v1beta2kind: ClusterConfigurationkubernetesVersion: v1.1

2021-04-07 18:54:11 174

原创 k8s高可用环境部署4(HA)

前言这一篇介绍的是配置k8s的高可用环境keepalived+Haproxy如果是实体服务器或VM虚拟机等建议使用这个方案。如果是阿里云等云服务器建议使用其官方的负载均衡方案。因为其与实体机的并不同,平台对网络环境限制较大。强行配置keepalive,有时反而不如其本身提供的负载方案。<1>keepalive部署在3台节点上执行,配置文件各节点都需修改部分参数,再启动yum install -y keepalivedcd /etc/keepalivedca

2021-04-07 16:36:27 54 1

原创 k8s高可用环境部署3(Etcd)

前言环境和部分软件已经配置好了,接着要部署一个Etcd集群。Etcd 通常是和master部署在一起,也有人会将 etcd独立于 k8s集群之外,以便于更好地扩展etcd集群。而此次是部署在3个master上。下面是关于Etcd的一些简单介绍:Etcd节点数:etcd 是基于raft算法的分布式键值数据库,在做决策时需要超半数节点的投票,所以 etcd集群 一般推荐奇数节点(3,5,7);etcd是高可用的,3节点etcd集群,最大容忍1台机器宕机。根据网上的资料还可以得出2个结论:设置偶数

2021-03-29 15:10:42 132

原创 k8s高可用环境部署2(Kubeadm编译)

虽然上一篇,已经yum安装了kubeadm。但是kubeadm如果直接拿来使用会存在一个问题,默认证书有效期为一年。因此需要在部署K8s前对kubeadm进行调整。链接地址如下:https://moxiao.blog.csdn.net/article/details/114290457...

2021-03-24 18:36:12 79

原创 k8s高可用环境部署1(系统初始化)

前言很多东西如果不做文档记录,以后通常会因为一些小问题,导致耽误时间。因此对Kubernetes的部分组件和部署进行基本的总结。环境初始化<3>以下,需在所有节点上执行<1>修改主机名(根据需求修改,分别修改。实际上要先做好规划,哪些服务器为master,哪些为node或其他服务,以下仅为示例)hostnamectl set-hostname k8s-master01hostnamectl set-hostname k8s-master02host

2021-03-24 18:27:28 80

原创 K8s集群node节点异常处理(Calico)

前言近期在测试环境k8s集群发现Calico的节点出现了异常,状态一直处于连接中,而且node节点的ip也出现了变化。于是对此次处理过程进行记录。这个异常不具备普遍性,因此文档仅供参考。发现在Calico 异常的node节点上,出现了大量的br开头的以及一些其他的虚拟网卡和虚拟ip. 应该是这些ip导致的。由于具体排查和处理需要大量的时间,为了不影响服务,先把异常节点下线。备注:可查看异常pod日志,再处理问题kubectl logs calico-node-f846j -

2021-03-19 17:23:53 470

原创 Kubeadm修改证书时间

前言目前关于k8s的部署有着各种各样工具,其中不得不提到Kubeadm。虽然其因证书问题一直被人们所诟病,但它也是部署k8s最常用的工具。我们都知道使用kubeadm部署k8s在证书方面存在一个问题。证书有效期为一年,到期前必须续期。因此使用kubeadm部署的集群,在...

2021-03-11 15:00:15 131

原创 磁盘分区的扩容

只是想说一下基本的扩容问题。。为什么需要扩容?扩容简单的来说就是扩充容量。通常情况下,随着业务或需求的发展,原来分配的资源不满足现在的需求,对原本的资源进行扩充,使其能满足需求。例如:你以前买了个500G的移动硬盘,以为够用了。结果几年之后,你下的东西太多了,存储不下你的东西了,要么删除,要么扩充你的磁盘空间。扩容方法:<1>在云服务器上,通常只需要付费就可以很快的进行磁盘扩容,也可以新挂载 硬盘/nfs 等产品来达到扩充资源的目的。如果担心数据丢失,通常应该在扩容前做一个快照,出现

2021-01-27 12:11:14 145

原创 Nexus搭建各类私服(npm私服)

前言写这个主要是因为一个一直以来碰到过很多次的问题,有时候代码的编译太慢,尤其是前端代码。平时就很慢了,从2019年后半年起,发现在某个时间段(20点之后),编译还会出现超时问题,导致编译失败。而测试环境,编译正常。后来,查到了问题原因: 公司内网的npm私服配置的npm的镜像地址为官网,当开发编译时要拉取的官网的第3方依赖没在私服的缓存中找到时,私服就会去请求官网,而大家都知道官网是国外的,所以导致超时问题。而开发在测试环境编译环境中配置的镜像源为淘宝镜像,因此很少遇到网络问题,即使有时候时间长点

2021-01-21 15:37:54 219

原创 route配置路由

前言由于前几天遇到路由问题,于是想起汇总一下route的常用操作。备注:不同的系统版本,命令可能有差异。简介路由规则类型主机路由路由选择表中指向单个IP地址或主机名的路由记录,Flags字段为H网络路由代表主机可以到达的网络,Flags字段为N默认路由当主机不能在路由表中查找到目标主机的IP地址或网络路由时,数据包就被发送到默认路由(默认网关)上。默认路由的Flags字段为G常用参数add 添加路由规则del 删

2021-01-04 22:21:48 275

原创 阿里云镜像迁移后的网络问题

前言最近由于腾讯云服务器快到期了,就想把上面的资料迁移到阿里云上。原因是个人在阿里云上创建了一个镜像,镜像里有各种实验留下来的资料,把这个镜像当做了一个备份,需要时也可开启上面的服务。这篇文章主要是记录的遇到的问题。迁移镜像由于镜像当初是放到了国外的可用区,使用自定义镜像创建云服务器是不可以跨地域的。就是说 同一个/不同账号 无法使用杭州的自定义镜像,去创建北京的云服务器。这时就需要把镜像复制到需要创建云服务的区域。复制镜像可把镜像复制到其他地域共享镜像可把镜像共享到其他账号<

2021-01-04 17:29:17 181

原创 Ansible-playbook执行慢问题处理

前言估计看到这个文档的人,应该都大致了解ansible。它是一款基于Python开发,完善的自动化运维工具,可以简单的实现批量的任务。由于其基于ssh,所以无需安装客户端,只要ssh可以登录上去,就可以执行批量的管理。举例来说:只要你会简单的ansible 命令,并且你的ansible服务器能登录其他服务器,就可以对大量的主机 批量安装软件,批量配置或发送文件,批量的添加计划任务,批量执行脚本等(目标主机的目录的权限和用户权限也得稍微注意点)。ansible也可以集成到Jenkins或者devlops

2020-12-07 17:35:39 601

原创 chrome与selenium的版本问题

异常某次收到自动化测试的相关报警,以为是出现了大问题。经验证后,自动化测试出现报警的功能在外网验证正常。问题原因可能原因:自动化测试用于验证的网站出现了异常自动化测试机的网络问题自动化测试服务异常解决方法环境:该自动化测试机为一台和 web服务器 同处于一个内网的windows服务器/虚拟机,安装谷歌浏览器,自动化测试使用的python脚本(使用了Selenium自动化测试工具),python环境为3.6环境。<1>外网或其他网络环境,通过手动点击浏览器

2020-11-23 18:55:03 273

原创 Openstack web界面登录异常处理

前言报错<1>某天正在使用openstack时,突然被退出了,输入平常的账号和密码,却弹出Unable to establish connection to keystone endpoint(无法建立与keystone终结点的连接)Unable to establish connection to keystone endpointMissing value auth-url required for auth plugin password在控制台输入openstack

2020-11-10 14:35:46 563

原创 iptables简述及使用汇总

前言某天看见内网服务器上一个ptables转发规则,突然想要总结一下iptables。。。iptables的应用环境简述一下了解到的目前 部分 公司 基本的安全措施:<1>cisco、华为…硬件防火墙保护网络安全、安全策略、异常流量监控 (云服务器:安全组,云盾)<2>jumpserver限制用户登录权限,操作记录 (云服务器:分配子账号进行权限控制)<3>tcp_warpper对ssh,ftp等服务提供访问控制,iptables/firewall

2020-10-24 22:09:52 261 1

原创 LDAP应用:OpenLDAP的备份,迁移及还原

前言通常一个当服务搭建起来后,我们不仅要考虑服务的高可用性,还要考虑数据备份和恢复。例如:svn,gitlab,wiki,jumpserver等重要的服务及其数据都需要一个备份和还原的措施。因此继LDAP的配置后,下面介绍的是基本的备份和恢复操作。LDAP备份基础环境Centos7.2slapd 2.4.44slapcat备份slapcat -v -l backup.ldifor slapcat > backup.ldif特点:仅在ldap服务器中执行,无需输

2020-09-24 20:12:57 790

原创 LDAP应用:OpenLDAP+PhpLDAPAdmin的配置

前言OpenLDAP是一款轻量级目录访问协议,是一套开源的集中账号管理架构,且被众多系统支持(例如: 各种Linux发行版本、Windows、Mac OS、IBM AIX等众多平台),被广大互联网公司和软件所采用(例如:jumpserver,jenkins,zabbix,gitlab,wiki,samba,sqladmin等各类常用软件)总之,任何内部 常用的可使用账号登陆的平台或软件基本都会支持关联ldap。它通常被用于关联各个平台或服务,达到统一身份认证的效果,一个账号和密码即可登陆各个平台,避免

2020-09-23 17:28:48 223

原创 MHA状态监控脚本

前言分享一个MHA状态监控的简易脚本,可钉钉告警。其他需求,需自行优化。需要在manager进程起来后,再执行.#!/bin/bashdingding () { curl "https://oapi.dingtalk.com/robot/send?access_token=$TOKEN" -H 'Content-Type: application/json' -d "{ \"msgtype\": \"text\", \"text\": {\"content\": \"MHA

2020-09-19 15:11:10 333

原创 如何使用阿里云进行直播点播

前言前一段时候,在兴趣的驱动下,研究了一下视频的直播和点播。大致是分为 自建的直播和点播平台 和 依靠云厂商来完成的直播和点播。 后来发现刚好阿里云还有OSS对象存储的套餐还没过期,正好介绍一下如何使用阿里云进行视频的直播。备注:关于依靠云厂商来实现的直播和点播,我觉得最重要是还要准备充足的费用。 如果没预估好价格和可使用时间,生产中就直接进行大规模的直播,不仅会产生费用问题,在扣无可口时,还会停止服务。 没交费导致的直播中断,也是遇到过的。域名管理首先要有一个已经备案的域名,后续都需要使

2020-07-28 18:07:27 1014

原创 k8s dashboard部分浏览器无法访问

前言当我们在配置完成dashboard,想要从浏览器查看的时候,通常会发现除了火狐浏览器。谷歌等大部分的浏览器,都无法进行访问。这种情况,我们可以通过自定义证书的方法,来使其他浏览器可以对dashboard进行访问。这里就不介绍dashboard的配置操作了。证书生成创建CA如果/etc/kubernetes/pki/或其他位置有ca证书,就无需另外生成openssl genrsa -out ca.key 2048openssl req -new -x509 -key ca.ke

2020-06-19 16:57:16 725

原创 harbor镜像列表的获取

前言我们都知道可以通过harbor的接口来获取单个的镜像的信息,但是格式方面比较麻烦,如果要直接pull某个镜像还得对命令进行拼接。下面分享的是通过命令行获取harbor镜像列表。如果获取不了信息或无法拉取镜像,建议从下方查找问题:与harbor的网络联通hurbor域名是否绑定账号或密码是否正确docker 的daemon.json文件中insecure-registries是否配置正确#!/bin/bash#查看hurbor可提供镜像USER="admin"

2020-06-18 14:03:13 1840 1

原创 python批量检测URL访问状态

前言由于环境问题弄了两个版本的脚本,下面分享一下。python2照着python3改的#-*- coding: utf-8 -*-#!/usr/bin/python#\..... --... ..--- ---..\..... ....- .---- --...#导入模块import timefrom io import openimport urllib2, urllib#解决中文字符问题import sysreload(sys)sys.setdefaultenc

2020-05-20 19:27:30 815

原创 误删Crontab计划任务的恢复

前言有的时候,由于误操作导致计划任务被删除,如果没有计划任务的备份或记录就麻烦了。因此下面介绍的是常用的误删Crontab计划任务的恢复操作。误删操作<1>误退出导致,ctrl +c 退出即可输入crontab后, ctrl +d<2>误清除crontab -r<3>误删文件执行ansible或其他命令,导致的cron文件丢失&...

2020-04-27 15:42:54 822

原创 rsync同步技巧---传输的速度限制

前言我们在使用rsync传输文件时,当服务器的带宽有限或机房进行了流量的限制,为了避免对服务的影响,通常是在不影响业务的时间传输或对rsync的传输速度进行限制,下面是rync限速操作及对部分相关参数的总结。Rsync参数简介常用参数-a --archive 归档模式,表示以递归方式传输文件,并保持(除了硬链接的)所有文件属性,等同于-...

2020-01-19 17:15:29 4490

原创 Centos6升级到Centos7

前言下面介绍的是Centos6升级Centos7的操作。实际上,如果该系统上有正在运行上且正在使用服务,禁止此类操作,因为要进行重启。如果此服务器上的还有需要的文件,注意要备份到其他服务器 。通常情况下为了避免部分软件升级后的不兼容等问题,会直接安排机房协助重装系统,因此这个操作并不怎么用到,。【1】备份重要文件【2】配置yum源vim /etc/yum.repos.d/upgr...

2019-12-30 19:44:27 1957

原创 (Cobbler)分区问题及解决

前言下面介绍的是Cobbler的ks文件分区异常导致的装机失败的解决方法。【1】boot分区通常情况下,如果要划分boot分区最少分配200M。实际上有时由于内核升级等原因boot空间会出现不足,后期得想办法清理或重新挂载。因此现在boot分区建议300-500M,也可以更大part /boot --fstype=ext4 --asprimary --size=200【2】b...

2019-12-30 16:03:00 1148

原创 Grafana密码重置

前言下面介绍的是各种情况下 Grafana忘记密码后进行的重置操作。【1】web重置当Grafana的邮件通知配置正常时,你可以通过web界面 点击忘记密码,通过邮件中的链接重置密码也可联系管理员进入web后台,修改该账户的密码<1>点击 忘记密码<2>输入邮箱后,点击发送Reset Password。到你的邮箱等待邮件<...

2019-12-18 16:35:19 3064 2

原创 SQL审核平台

前言下面统计几个开源的Sql审核平台。如需完整内容可跳转至其github查看。SQL审核查询平台Arkcontrolgithub地址:https://github.com/arkcontrol/arkcontrol是由极数云舟研发的MySQL日常运维和集群管理的自动化平台,提供MySQL的集群管理、实例管理、监控备份、日常巡检、参数建议等等多种功能。有官方支持。incep...

2019-12-17 15:32:56 2293

转载 (转载)Jenkins的邮件模板

前言下面是网上收集的jenkins邮件发送的正文.【1】来源:https://www.cnblogs.com/imyalost/p/8781759.htmlDefault Subject邮件标题Jenkins构建通知:$PROJECT_NAME - Build # $BUILD_NUMBER - $BUILD_STATUS!Default Content邮件正文<!D...

2019-12-12 10:23:25 299

原创 OOM-killer kill重要进程的问题解决

前言下面介绍的是防止Linux中OOM-killer杀死重要进程的操作。(不写前言感觉没有灵魂。。就随便写一句)OOM-killer简介linux oom-killer的机制: (oom就是out of memory,内存用尽)linux为了避免内存用尽,导致系统的卡死,会唤醒oom_killer,找出/proc//oom_score值最大的进程将之kill掉,从而释放内存,来...

2019-12-11 18:38:43 1595

原创 /var/spool/postfix/maildrop占用空间大量处理

前言近期有台服务器的磁盘爆满,查找后发现是/var/spool/postfix/maildrop有大量文件占用空间导致。原因由于centos6/7在执行cron时,会将cron执行脚本中产生的信息以邮件的形式发送cron的所有者,但是由于sendmail或postfix邮件发送未正常运行,导致邮件发送不成功,堆积在了maildrop目录下面.存在大量crontab定时任务但脚本或...

2019-12-11 12:52:20 1313

转载 (转载)Tomcat的JVM内存溢出解决方法

原文作者: 我是超越原文链接:https://blog.csdn.net/cyjch/article/details/51543329版权声明:本文为CSDN博主「我是超越」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。在生产环境中,tomcat内存设置不好很容易出现JVM内存溢,解决方法就是修改Tomcat中的catalina.sh文件。在...

2019-12-03 17:03:29 268

转载 (转载)内存泄漏和内存溢出的区别与解决方式

原文作者:白木棉原文链接:https://blog.csdn.net/jie1175623465/article/details/81121548版权声明:本文为CSDN博主「白木棉」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。内存泄漏(memory leak ) 内存溢出 (out of memory)内存泄露 :是指程序在申请内存后,无...

2019-12-03 16:53:59 116

空空如也

博客总访问量显示异常

发表于 2019-05-16 最后回复 2019-05-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除