operation architect in the way

记录自己运维实践,分享自己运维心得,也会收藏一些去伪存真的干货文章(talk is cheap,show your code)。...

ansible的shell模块使用cat命令--EOF结束文本输入问题

使用ansible写一个playbook,使用shell模块,在模块中使用cat命令输入一段文本,在使用EOF结束文本时,却没有达到预期效果,EOF本身也被当做了文本重定向到文件了。 如上图为使用的playbook文件。 如上图,在生成的文件中,EOF用来标记输入结束的文本,也被写入了...

2019-05-26 20:10:49

阅读数 123

评论数 0

ingress-nginx-controller 504 gateway time-out 问题

问题背景: 某应用的后台,通过后面界面上传一个excel文件时,上传到半截是,后面界面显示 504 gateway time-out错误。 问题调查: 经了解,后台应用界面为使用ingress方式访问,504错误界面显示的nginx版本信息和ingress-nginx...

2019-04-25 23:41:23

阅读数 388

评论数 0

ansible的shell模板使用awk包含引号的问题

在使用ansible的shell模块,执行一个清理k8s集群容器日志的命令时,遭遇如下错误,Extraneous options or arguments: 在去掉awk后面的命令时,发现执行正常,定位问题点在awk这一段,后经测试,在于awk内的双引号问题,需要转义,改成如下正常执行...

2019-04-06 23:30:56

阅读数 222

评论数 0

Python selenium模块报错解决

      在使用selenium的webdriver示例化Firefox和Chrome对象时,发现如下报错。 如上图,实例Firefox对象,报错:selenium.common.exceptions.WebDriverException: Message: invalid argumen...

2019-01-22 22:19:23

阅读数 694

评论数 0

redis密码破解(multiprocessing的Pool多进程模式)-join方法小坑

       之前使用multiprocessing的分布式进程模式写了个redis的破解程序,性能不是很理想,相对于单进程模式性能反而有下降.于是想利用multiprocessing的多进程模式进行破解,初始代码如下: #!/usr/bin/env python # -*- coding: ...

2019-01-09 22:47:11

阅读数 755

评论数 0

redis密码破解(Python使用multiprocessing分布式进程)

           前面redis密码破解都是在一台机器单进程运行的,于是想如果在多台机器分布式运行,速度会不会快点,用Python的multiprocessing模块的managers子模块写了个破解程序,代码如下:           master端,代码如下: #!/usr/bin/...

2018-12-31 22:22:28

阅读数 637

评论数 0

redis密码破解(python使用redis模块)

         昨天用socket模块写了个破解redis密码的脚本,今天用Python redis模块在写了个,同一个密码文本,发现redis模块速度明显不如socket模块,代码如下: #!/usr/bin/env python # -*- coding: utf-8 -*- # @Ti...

2018-12-28 20:07:29

阅读数 719

评论数 0

redis密码破解(python使用socket模块)

         偶尔看到一篇讲述redis未授权访问漏洞的,提到用hydra进行redis密码的破解。测试了下,发现安装的hydra竟然无法破解出密码,且速度很慢(hydra版本 v8.2-dev)。     如上图,用一个for循环生成个随机密码测试文件,将正确密码写入。 如上图,...

2018-12-27 20:58:52

阅读数 696

评论数 1

修改云主机快照方式为live snapshot

          客户反馈虚拟机做快照时一直无法连接(后端存储使用的为ceph),远程测试发现做快照时无法ping通,vnc无法登录. 如上图,在做快照期间,ping虚拟机的ip中间会出现"请求超时" 如上图,快照期间,vnc也无法登录了. 在虚...

2018-10-31 00:01:57

阅读数 200

评论数 0

虚拟机重启错误,libvirtError:internal error:process exited while connecting to monitor

    客户云环境一台虚拟机,反馈重启不成功。经了解,客户环境使用的后端为ceph,故障虚拟机挂载一块云硬盘。     收集客户的nova-compute日志,发现报错如下:      libvirtError:internal error:process exited  while conn...

2018-10-28 23:46:49

阅读数 1490

评论数 0

rabbitmqadmin的配置文件问题

         一个rabbitmq集群,通过rabbitmq-plugins enable rabbitmq_management启用了管理插件,下载了rabbitmqadmin命令文件,但是执行rabbitmqadmin  list queues命令时报错 :    *** Access ...

2018-10-18 22:00:07

阅读数 858

评论数 0

一次虚拟机热迁移失败处理,使用nova live-migration-force-complete强制暂停下虚拟机

         客户反馈2台虚拟机热迁移失败,检查源计算节点的nova-compute日志,均发现live migration  stuck xxx  sec的错误信息。 虚拟机热迁移的过程,在源节点和目标节点会有同步虚拟机内存的操作,查看stuck日志之前的输出,问题memory 基...

2018-10-02 22:12:03

阅读数 635

评论数 0

一次centos7.3系统中病毒排查经历

      一个环境,突然使用很卡顿,于是用top查看什么进程占用了资源,发现进程中有大量b开头的进程,基本确定系统是中病毒了。 如上图,top显示大量b开头进程,进程号还不停的变。快速用lsof -p <PID>,查看一个病毒进程,结果如下 ...

2018-09-05 23:13:39

阅读数 1674

评论数 0

ceph pg卡在unclean和backfill_toofull

       一个环境,很多osd处于nearfull状态,在给osd做reweight的时候,发现有2个pg一直卡在unclean和backfill_toofull状态。 执行ceph health detail 如上图,我们发现,卡住的一个pg 为2.689,执行ceph pg m...

2018-08-30 15:09:12

阅读数 714

评论数 0

multipath路径残留导致虚拟机无法重启

客户反馈一台虚拟机重启后虚拟机状态显示为错误。检查云平台各个组件服务,未发现异常后,首先尝试重置虚拟机状态,然后硬重启看下 一段时间后,虚拟机状态仍然为error。检查虚拟机所在计算节点的nova-compute日志,发现如下错误日志显示,终止虚拟机的qemu-kvm进程时失败(Failed to...

2018-06-11 23:26:06

阅读数 946

评论数 0

multipath配置错误导致的云平台虚拟机挂载云硬盘失败

    客户反馈云平台商业存储类型的云硬盘无法挂载上(cinder通过FC协议对接),但是ceph类型云硬盘使用正常.    登录打开cinder的debug模式,在volume日志没有显示任何错误信息,日志显示cinder有删除映射关系的操作. 继续查看挂载虚拟机的所在计算节点的nova-com...

2018-06-11 17:44:45

阅读数 293

评论数 0

kubernetes v1.8.3安装coredns

coredns的部署yaml文件如下: apiVersion: v1 kind: ServiceAccount metadata:   name: coredns   namespace: kube-system   labels:       kubernetes.io/cluster-serv...

2018-04-08 17:10:13

阅读数 676

评论数 0

helm安装chart----percona-xtradb-cluster实践记录

chart来自kubernetes官方github地址        https://github.com/kubernetes/charts/tree/master/stable  1、修改values.yaml,镜像地址改为本地的镜像仓库,否则从公网拉取时间会很长;修改启用pv并...

2018-04-08 15:14:34

阅读数 741

评论数 0

elasticsearch性能调优相关

转载自  https://blog.csdn.net/liukuan73/article/details/79261125http://nocf-www.elastic.co/guide/en/elasticsearch/reference/current/indices-create-index...

2018-03-27 15:37:15

阅读数 79

评论数 0

nova hypervisor-list无法执行,其他api均正常

平台中有一些计算节点下架,通过nova service-delete ID将其删除后,admin用户登录dashboard,提示"Can't get hareware usage",之后迅速退出登录,后台执行nova hypervisor-list命令后,无法执行成功,提示如下...

2018-03-20 15:33:06

阅读数 797

评论数 0

提示
确定要删除当前文章?
取消 删除