k8s- unknown问题排查

2 篇文章 0 订阅

一、问题描述

kubernetes pod NodeLost 分析

环境

系统: centOS7
k8s 1 master, 2 node

IP
k8smaster176
k8snode175
k8snode176

kubelet、kube-proxy、kube-dns直接安装在linux系统上

问题

卸载监控时,一直一些组件未删除(正常是所有相关组件会被删除)

[root@docker176 docker]# kubectl -n kube-system get pod,svc                    
NAME                                           READY     STATUS     RESTARTS   AGE
po/calico-node-hmv3f                           2/2       Running    0          12d
po/calico-node-qvk9m                           2/2       NodeLost   4          19d
po/calico-policy-controller-2698340612-cbvh2   1/1       Running    0          23h
po/calico-policy-controller-2698340612-kgdkk   1/1       Unknown    2          19d
po/heapster-v1.3.0-3194101127-5q02n            2/2       Unknown    4          19d

二、原因

查看到 175节点 NotReady状态,不正常

[root@docker176 docker]# kubectl get nodes
NAME             STATUS     AGE       VERSION
192.168.14.175   NotReady   19d       v1.6.2
192.168.14.176   Ready      12d       v1.6.2

查看问题pod所在节点信息 kubectl -n kube-system describe pod calico-policy-controller-2698340612-kgdkk,此pod部署在175这个问题节点上

[root@docker176 ~]# kubectl -n kube-system describe pod calico-policy-controller-2698340612-kgdkk
Name:                           calico-policy-controller-2698340612-kgdkk
Namespace:                      kube-system
Node:                           192.168.14.175/192.168.14.175
Start Time:                     Fri, 22 Feb 2019 00:24:56 +0800

三、问题解决方法

1. 删除节点

kubectl delete node 192.168.14.175

[root@docker176 docker]# kubectl get nodes                 
NAME             STATUS     AGE       VERSION
192.168.14.175   NotReady   19d       v1.6.2
192.168.14.176   Ready      12d       v1.6.2
[root@docker176 docker]# kubectl delete node 192.168.14.175
node "192.168.14.175" deleted

2. 重启 kubelet

[root@docker175 ~]# systemctl restart kubelet

查看是否正常启动注册,STATUS 为 Ready表示成功启动并注册到k8s的master中

[root@docker176 docker]# kubectl get nodes
NAME             STATUS    AGE       VERSION
192.168.14.175   Ready     13s       v1.6.2
192.168.14.176   Ready     12d       v1.6.2

查看组件是否删除,heapster把所有组件删除了

[root@docker176 ~]# kubectl -n kube-system get pod,svc
NAME                                           READY     STATUS    RESTARTS   AGE
po/calico-node-hmv3f                           2/2       Running   0          12d
po/calico-node-z6skb                           2/2       Running   0          3m
po/calico-policy-controller-2698340612-cbvh2   1/1       Running   0          23h
po/kube-dns-3412393464-csgt3                   3/3       Running   2          23h

NAME           CLUSTER-IP    EXTERNAL-IP   PORT(S)         AGE
svc/kube-dns   10.254.0.10   <none>        53/UDP,53/TCP   75d
svc/kubelet    None          <none>        10250/TCP       20d

k8s删除一个Node并重新加入集群

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值