k8s和k8s遇到的问题
文章平均质量分 53
k8s 的使用和k8s 使用过程中遇到的问题
哪有天生的学霸,一切都是厚积薄发
天道酬勤,商道酬信,学道酬苦,业道酬精 ,人道酬诚。
展开
-
etcd故障-recovering backend from snapshot error: failed to find database snapshot file
etcd 故障转载 2023-10-09 11:28:45 · 907 阅读 · 0 评论 -
kubeadm部署的集群在集群关机重启后起不来解决办法
kubeadm部署的集群在集群关机重启后起不来解决办法原创 2023-08-29 22:52:31 · 826 阅读 · 0 评论 -
电脑蓝屏重启后master和node 节点出现node “master” not found node “node01” not found
电脑蓝屏重启后master和node 节点出现node “master” not found node “node01” not found原创 2023-06-17 11:51:32 · 1814 阅读 · 0 评论 -
NFS 报错 clnt_create: RPC: Program not registered
nfs 报错原创 2023-06-11 22:48:15 · 5225 阅读 · 0 评论 -
K8s排错之浏览器打不开K8s Dashboard
浏览器无法访问k8s dashboard原创 2023-05-13 22:52:04 · 2784 阅读 · 1 评论 -
[kubernetes]Calico运行异常:dial tcp 10.96.0.1:443: connect: connection refused
内置的 kubernetes service 无法删除,其 ClusterIP 为通过 --service-cluster-ip-range 参数指定的 ip 段中的首个 ip,kubernetes endpoints 中的 ip 以及 port 可以通过 --advertise-address 和 --secure-port 启动参数来指定。原文链接:https://blog.csdn.net/dingpwen/article/details/124444614。那么这个10.96.0.1到底是什么呢?转载 2023-05-12 21:37:03 · 3659 阅读 · 0 评论 -
云计算时代操作系统K8s 之pod 生命周期综述
pod 生命周期详解转载 2023-03-31 17:12:30 · 677 阅读 · 0 评论 -
k8s中Pod 无法正常解析域名:部署 DNS 调试工具排查
k8s中Pod 无法正常解析域名:部署 DNS 调试工具排查转载 2023-03-11 23:10:23 · 3668 阅读 · 1 评论 -
calico/node is not ready: felix is not ready: Get “http://localhost:9099/readiness“: dial tcp: looku
calico pod 报错原创 2023-03-07 19:59:23 · 2158 阅读 · 0 评论 -
Unable to attach or mount volumes: unmounted volumes=[nfs-client-root], unattached volumes=[nfs-clie
关于k8s 集群创建存储类报错原创 2023-03-06 12:54:46 · 2843 阅读 · 0 评论 -
部署Pod非Running状态,describe查看显示node资源不足
一、node 节点资源不足的几种情况:1、执行kubectl top node 查看是否真的资源不足。2、报资源不足有多种情况:第一种是真的资源不足,第二种可能是Node上没有打Pod的yaml中定义的nodeSelector: 标签所以导致Pod找不到合适的Node就报此错误。第二种node上是否无Pod Yaml中nodeSelector: 所需标签的确认法:2.1、对Pod或者Pod的rc执行 kubectl get pod -n $namespace $Pod名 -o ya转载 2022-05-03 17:41:06 · 1449 阅读 · 0 评论 -
k8s集群coredns无法解析外部域名
1. 问题现象公司内部SaaS产品运行在阿里云kubernetes环境,使用阿里云[标准托管版]进行部署使用,[标准托管版] 版就是用户只需要自己运维k8s node节点,master节点由阿里云进行维护,当k8s环境部署完成之后,将公司生产业务部署后发现部分业务模块无法解析到阿里云OSS自定义的对象存储域名,导致业务出现异常;业务模块是可以通过域名访问其他业务模块及互联网域名的,而且业务模块配置了SNAT都是可以访问互联网的1.1. 问题分析公司域名后缀为*.oneprocloud.com,统一方转载 2022-04-23 22:45:40 · 3044 阅读 · 0 评论 -
pod报错“Back-off restarting failed container“解决办法
pod报错"Back-off restarting failed container"解决办法现象Events: Type Reason Age From Message ---- ------ ---- ---- ------- Normal Scheduled 2m48s default-sc原创 2022-04-23 11:07:18 · 3496 阅读 · 0 评论 -
kubeasz问题-FAILED - RETRYING: 轮询等待node达到Ready状态
TASK [kube-node : 轮询等待kubelet启动] ***********************************************************************************************************************************************************FAILED - RETRYING: 轮询等待kubelet启动 (4 retries left).FAILED - RETRY..原创 2022-04-17 21:58:50 · 1630 阅读 · 0 评论 -
data could not be sent to remote host
1.在执行k8s 初始化的时候老是报错:data could not be sent to remote hostroot@master1:/etc/kubeasz# ./ezctl setup k8s-01 01ansible-playbook -i clusters/k8s-01/hosts -e @clusters/k8s-01/config.yml playbooks/01.prepare.yml2022-04-17 18:05:37 INFO cluster:k8s-01 setup st原创 2022-04-17 19:02:44 · 3723 阅读 · 0 评论 -
采坑指南——域名解析问题排查过程
前几天,在ucloud上搭建的k8s集群(搭建教程后续会发出)。今天发现域名解析不了。组件版本:k8s 1.15.0,coredns:1.3.1过程是这样的:首先用以下yaml文件创建了一个nginx服务apiVersion: v1kind: Servicemetadata: name: nginx-svc-old labels: app: nginx-svcspec: selector: app: nginx ports: - protocol: TCP转载 2022-04-09 17:02:12 · 389 阅读 · 0 评论 -
The connection to the server localhost:8080 was refused - did you specify the right host or port?
问题分析环境变量原因:kubernetes master没有与本机绑定,集群初始化的时候没有绑定,此时设置在本机的环境变量即可解决问题。问题图片解决方式步骤一:设置环境变量具体根据情况,此处记录linux设置该环境变量方式一:编辑文件设置 vim /etc/profile 在底部增加新的环境变量 export KUBECONFIG=/etc/kubernetes/admin.conf方式二:直接追加文件内容 echo "export KUBECONFIG=/etc/ku转载 2022-02-17 10:28:52 · 1302 阅读 · 0 评论 -
Unable to connect to the server: http: server gave HTTP response to HTTPS client
我在执行kubectl get nodes 查看节点 结果等了好久都不行 还出了问题,报错信息如下:Unable to connect to the server: http: server gave HTTP response to HTTPS client后来 我在一篇博客中看到 才意识到可能是我虚拟机的内存分小了,以前我给我的虚拟机分了3g 那时候没问题 后来因为电脑上内存一共只有8g 之后 就分了1.5g当我把内存由1.5g改为2.5g之后 ,此时再执行 kubectl get nodes 就转载 2022-02-16 22:34:47 · 1609 阅读 · 0 评论 -
The HTTP call equal to ‘curl -sSL http://localhost:10248/healthz‘ failed with error: Get “http://loc
kubeadm 方式初始化集群报错原创 2022-02-13 12:17:20 · 9794 阅读 · 3 评论 -
k8s 中 kubectl get 命令详解
一、 获取列出一个或多个资源的信息。1.可以使用的资源包括:allcertificatesigningrequests (aka 'csr')clusterrolebindingsclusterrolesclusters (valid only for federation apiservers)componentstatuses (aka 'cs')configmaps (aka 'cm')controllerrevisionscronjobsdaemonsets (aka 'ds'原创 2022-02-07 14:10:42 · 8167 阅读 · 0 评论