kubelet日志报错node not found处理

文章讲述了在运行正常的Kubernetes集群中,由于磁盘空间不足引发的kubelet服务不可用问题。通过排查发现是docker容器占用大量磁盘,清理日志后重启服务解决了问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

之前正常运行的环境,突然反馈Kubernetes集群不可用,无法执行kubectl命令。

查看kubelet服务状态,看到日志中提示node "master1" not found

[root@master1 var]# systemctl status kubelet
● kubelet.service - kubelet: The Kubernetes Node Agent
   Loaded: loaded (/usr/lib/systemd/system/kubelet.service; enabled; vendor preset: disabled)
  Drop-In: /usr/lib/systemd/system/kubelet.service.d
           └─10-kubeadm.conf
   Active: active (running) since Thu 2022-05-05 10:32:20 CST; 13s ago
     Docs: https://kubernetes.io/docs/
 Main PID: 15016 (kubelet)
    Tasks: 14
   Memory: 38.7M
   CGroup: /system.slice/kubelet.service
           └─15016 /usr/bin/kubelet --bootstrap-kubeconfig=/etc/kubernetes/bootstrap-kubelet.conf --kubeconfig=/etc/kubernetes/kubelet.conf --config=/var/lib/kubelet/config.yaml --network-plugin=cni --pod...

May 05 10:32:32 master1 kubelet[15016]: E0505 10:32:32.353984   15016 kubelet.go:2263] node "master1" not found
May 05 10:32:32 master1 kubelet[15016]: E0505 10:32:32.454152   15016 kubelet.go:2263] node "master1" not found
May 05 10:32:32 master1 kubelet[15016]: E0505 10:32:32.554312   15016 kubelet.go:2263] node "master1" not found
May 05 10:32:32 master1 kubelet[15016]: E0505 10:32:32.654451   15016 kubelet.go:2263] node "master1" not found
May 05 10:32:32 master1 kubelet[15016]: E0505 10:32:32.754553   15016 kubelet.go:2263] node "master1" not found

master1节点就是本机,网络都是正常的,尝试重启kubelet服务无果。

无意中在输入命令时,使用tab键补全命令,得到了错误的提示:

[root@master1 log]# cat yum-bash: cannot create temp file for here-document: No space left on device

发现应该是磁盘空间不足了,查看磁盘使用量发现,果然磁盘已经占用100%了。

[root@master1 var]# df -h
Filesystem                   Size  Used Avail Use% Mounted on
/dev/mapper/centos_202-root   39G   39G   20K 100% /
devtmpfs                     3.9G     0  3.9G   0% /dev
tmpfs                        3.9G  4.0K  3.9G   1% /dev/shm
tmpfs                        3.9G  385M  3.5G  10% /run
tmpfs                        3.9G     0  3.9G   0% /sys/fs/cgroup
/dev/loop0                    11G   11G     0 100% /opt/centos

定位到docker容器目录下,有个容器占用了大量的磁盘,因为该容器长时间输出错误日志导致。

[root@master1 0d7b200dd9209005759e20e3286a21b1435ff05c2179847a5f294deeb9bba52f]# ls -hlst
total 11G
 11G -rw-r----- 1 root root  11G May  3 06:51 0d7b200dd9209005759e20e3286a21b1435ff05c2179847a5f294deeb9bba52f-json.log
8.0K -rw------- 1 root root 5.8K Apr 24 09:29 config.v2.json
4.0K -rw-r--r-- 1 root root 2.0K Apr 24 09:29 hostconfig.json
   0 drwx------ 2 root root    6 Apr 24 09:29 mounts
   0 drwx------ 2 root root    6 Apr 24 09:29 checkpoints

清空该容器控制台日志文件:

cat /dev/null > 0d7b200dd9209005759e20e3286a21b1435ff05c2179847a5f294deeb9bba52f-json.log 

重启dockerkubelet服务后,Kubernetes集群恢复。

systemctl restart docker
systemctl restart kubelet
"Error getting node" err="node \"cloudnative-node52\" not found"的错误可能是由以下原因引起的:1. kubelet未运行;2. kubelet由于节点的某种错误配置而不健康(例如禁用了所需的cgroups)。 要解决这个问题,您可以执行以下步骤: 1. 检查kubelet是否正在运行。您可以使用以下命令检查kubelet的状态:`systemctl status kubelet`。 2. 如果kubelet未运行,请启动kubelet:`systemctl start kubelet`。 3. 如果kubelet处于不健康状态,您可以检查节点的配置,确保没有禁用所需的cgroups。您可以编辑kubelet的配置文件(通常位于`/etc/kubernetes/kubelet.conf`),并确保cgroups被正确配置。 如果以上步骤没有解决问题,您可以进一步检查控制平面组件是否崩溃或在容器运行时启动时退出。您可以使用容器运行时的命令行界面列出所有正在运行的Kubernetes容器,例如使用crictl命令:`crictl --runtime-endpoint unix:///var/run/containerd/containerd.sock ps -a | grep kube | grep -v pause`。一旦找到出错的容器,您可以使用以下命令检查其日志:`crictl --runtime-endpoint unix:///var/run/containerd/containerd.sock logs CONTAINERID`。这将帮助您进一步排查问题。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [k8s初始化 报错Error getting node“ err=“node](https://blog.csdn.net/weixin_66536807/article/details/124903478)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [node-catc:Node Cloud At Cost API 包装器](https://download.csdn.net/download/weixin_42133452/19376444)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值