
故障排错
文章平均质量分 51
实践过程中的故障排错
王大雏
实现自由
展开
-
脑裂问题与解决(keepalived脑裂的解决和预防)
脑裂问题与解决(keepalived脑裂的解决和预防)一、keepalived脑裂二、什么是裂脑?三、keepalived脑裂产生的原因四、常见的解决方案五、解决keepalived脑裂问题六、曾经碰到的一个keepalived脑裂的问题七、预防keepalived脑裂问题八、推荐自己写脚本一、keepalived脑裂Keepalived的作用是检测服务器的状态,如果有一台web服务器宕机,或工作出现故障,Keepalived将检测到,并将有故障的服务器从系统中剔除,同时使用其他服务器代替该服务器的工作原创 2021-08-18 22:33:53 · 16350 阅读 · 0 评论 -
flannel网络问题:node节点flannel网络问题导致该node上的pod与其他node节点网络不通的排查思路与解决
flannel网络问题:node节点flannel网络问题导致该node上的pod与其他node节点网络不通的排查思路与解决一、问题发现二、问题排查一、问题发现在部署一个replicas:4的nginx deployment之后在master节点通过curl + podIP + 端口的形式测试时,发现两次访问不到,两次可以访问得到。二、问题排查1、通过ping pod的ip地址,发现node1节点的pod全都ping不通,问题很有可能就出在node1节点上2、通过ip a查看node1节点发现fl原创 2021-08-13 19:09:56 · 5859 阅读 · 0 评论 -
k8s集群搭建报错:error:kubectl get csr No resources found.
k8s集群搭建报错:error:kubectl get csr No resources found.问题原因解决方法测试成功问题kubectl get csrNo resources found.原因因为原来的ssl证书在重启后失效了,不删除的话,即重启kubelet也无法与master通讯解决方法node节点cd /opt/kubernetes/ssllskubelet-client-2021-04-14-08-41-36.pem kubelet-client-current.p原创 2021-08-13 18:42:07 · 3270 阅读 · 1 评论 -
k8s单节点部署报错:[root@master ~]# kubectl get nodes No resources found.
k8s单节点部署报错:[root@master ~]# kubectl get nodes No resources found.问题排查思路问题[root@master ~]# kubectl get nodes No resources found.排查思路所有节点:1.关闭防火墙: systemctl stop firewalldsystemctl disable firewalld 2.关闭selinux: sed -i 's/enforcing/disabled/' /et原创 2021-08-13 18:40:51 · 1951 阅读 · 2 评论 -
docker安装错误:错误:软件包:docker-ce-rootless-extras-20.10.8-3.el7.x86_64 (docker-ce-stable)跳过(依赖问题)
docker安装错误:错误:软件包:docker-ce-rootless-extras-20.10.8-3.el7.x86_64 跳过(依赖问题)问题排查思路1、先按提示尝试添加 --skip-broken 选项来解决该问题2、查看安装源目录解决办法成功!!!问题[root@node01 /etc/yum.repos.d]# yum install docker-ce docker-ce-cli containerd.io已加载插件:fastestmirror, langpacksLoading原创 2021-08-13 00:05:52 · 15152 阅读 · 4 评论 -
Docker删除报错:Error response from daemon: conflict: unable to delete 08b152afcfae (must be forced)
Docker删除报错:Error response from daemon: conflict: unable to delete 08b152afcfae must be forced - image is referenced in multiple repositories问题解决办法补充docker删除命令1、运行时的删除2、删除所有未被 tag 标记和未被容器使用的镜像3、删除所有未被容器使用的镜像4、删除所有停止运行的容器5、删除所有未被挂载的卷6、删除所有网络7、删除 docker 所有资源原创 2021-08-02 23:14:45 · 456 阅读 · 0 评论 -
docker上传镜像错误:errors: denied: requested access to the resource is denied unauthorized: authentication
docker上传镜像错误:errors: denied: requested access to the resource is denied unauthorized: authentication问题解决办法问题docker上传镜像错误errors:denied: requested access to the resource is deniedunauthorized: authentication required解决办法在上传镜像之前,还需要先对本地镜像添加新的标签,然后再使用原创 2021-08-02 22:38:55 · 5188 阅读 · 0 评论 -
/var/run/yum.pid 已被锁定,PID 为 73057 的另一个程序正在运行。解决方法
/var/run/yum.pid 已被锁定,PID 为 73057 的另一个程序正在运行。解决方法问题解决方法问题安装时端口被占用解决方法kill杀死进程即可,用端口号杀死,其他端口类似成功!原创 2021-07-28 07:24:22 · 483 阅读 · 0 评论 -
@ERROR: auth failed on module wwwroot rsync error: error starting client-server protocol (code 5) at
@ERROR: auth failed on module wwwroot问题解决办法问题@ERROR: auth failed on module wwwrootrsync error: error starting client-server protocol (code 5) at main.c(1516) [Receiver=3.0.9]解决办法账户数据文件与配置文件里的路径不符修改master的rsync配置文件修改后成功!...原创 2021-07-20 17:05:09 · 1101 阅读 · 0 评论 -
bash: redis-sentinel: 未找到命令...(解决办法)
bash: redis-sentinel: 未找到命令...(解决办法)问题解决办法问题redis-sentinel sentinel.conf &bash: redis-sentinel: 未找到命令...解决办法差了一个全局命令,将/redis/bin目录下的可执行文件创建软链接至路径环境变量中,便于系统识别,相当于一个快捷方式成功!...原创 2021-07-18 18:47:31 · 2253 阅读 · 1 评论 -
/var/run/yum.pid 已被锁定,PID 为 66245 的另一个程序正在运行。解决办法
/var/run/yum.pid 已被锁定,PID 为 66245 的另一个程序正在运行。解决办法问题解决办法问题执行yum install -y gcc gcc-c++ make报错[root@slave2 ~]# yum install -y gcc gcc-c++ make已加载插件:fastestmirror, langpacks/var/run/yum.pid 已被锁定,PID 为 66245 的另一个程序正在运行。Another app is currently holding原创 2021-07-18 16:06:07 · 612 阅读 · 0 评论 -
http启动(重启)报错:Job for httpd.service failed because the control process exited with error code.
http启动(重启)报错:Job for httpd.service failed because the control process exited with error code. See "systemctl status httpd.service" and "journalctl -xe" for details.【问题】1、http启动(重启)报错【解决方案】1、用systemctl status httpd.service查看,发现80端口被占用2、用netstat -antlp | gre原创 2021-07-08 09:01:24 · 46284 阅读 · 5 评论 -
如何解决“该虚拟机正在使用中”无法打开问题
如何解决“该虚拟机正在使用中”无法打开问题一、问题二、解决办法三、结果一、问题在打开虚拟机的时候显示改虚拟机正在使用,注意不要选择获取所有权,否则就会破坏虚拟机!二、解决办法找到路径文件,找到其中.lck的文件并删除三、结果开启可以正常运行...原创 2021-06-01 19:23:31 · 1359 阅读 · 0 评论