k8s
at1358
这个作者很懒,什么都没留下…
展开
-
二进制部署高可用k8s集群
ip地址规划表k8s-master1 192.168.2.190 包含etcd存储此为etc主节点k8s-master2 192.168.2.191k8s-node1 192.168.2.192 包含etcd存储etcd从节点1k8s-node2 192.168.2.193 包含etcd存储etcd从节点2k8s-node3 192.168.2.194 包含etcd存储etcd从节点3k8s-LB01 192.168.2.195k8s-LB02 1原创 2021-03-18 10:39:11 · 2066 阅读 · 1 评论 -
生产k8s集群pod异常重启处于Terminating状态
开发在阿里云edas执行发布后,prod-rig-portal应用的pod一直处理Terminating状态在容器服务-kubernetes查看prod-rig-portal应用的pod也是处于Terminating状态在阿里云后台容器服务-kubernetes进行删除,删除后会一直重建此pod在node节点进行查看也是处于Terminating状态使用命令强制删除[root@k8s .kube]# kubectl delete pods prod-rig-portal-d7f604d8原创 2021-03-04 11:16:49 · 1393 阅读 · 1 评论 -
生产阿里云容器服务-kubernetes集群资源不足报错nodes are available: 2 Insufficient cpu
报错信息 : nodes are available: 2 Insufficient cpu问题描述 : 容器集群kubernetes,在edas上面做配置修改发布一直是执行状态,去到容器服务kubernetes上面查看报错nodes are available: 2 Insufficient cpu检查之后发现是因为节点上的CPU资源不足Pod调度了,Pod的所需资源就是Pod的request值,节点上剩余request的值不能满足Pod的所需资源的话,就不再能够调度。最后降低一些pod的所需原创 2021-03-04 11:14:33 · 2300 阅读 · 1 评论 -
k8s无法进入容器报错和解决方法
如报错:Error from server: error dialing backend: dial tcp: lookup k8s-node2 on 8.8.8.8:53: no such hostError from server: error dialing backend: dial tcp 192.168.2.192:10250: connect: connection refused此故障是hosts文件解析名称和节点主机名称,以及配置文件kube-proxy.kubeconfig不一致所原创 2021-03-04 11:11:39 · 4793 阅读 · 3 评论 -
k8s集群pod出现Evicted状态
生产pod出现Evicted状态其中报错提示检查原因,发现是磁盘压力导致pod被驱逐,IO匹配不了应用的需求,导致pod被驱逐,更换更高规格的磁盘可以解决此问题Evicted状态的pod直接删除即可。原创 2021-03-04 11:11:02 · 1206 阅读 · 1 评论 -
生产阿里云容器服务-kubernetes集群资源不足报错nodes are available: 2 Insufficient cpu
报错信息 : nodes are available: 2 Insufficient cpu问题描述 : 容器集群kubernetes,在edas上面做配置修改发布一直是执行状态,去到容器服务kubernetes上面查看报错nodes are available: 2 Insufficient cpu检查之后发现是因为节点上的CPU资源不足Pod调度了,Pod的所需资源就是Pod的request值,节点上剩余request的值不能满足Pod的所需资源的话,就不再能够调度。最后降低一些pod的所需原创 2021-02-05 16:00:58 · 10008 阅读 · 0 评论 -
阿里云k8s出现大量Terminating和Init状态的pod
检查/var/log/messages日志发现报错:Jan 19 11:40:13 iZbp1cl iwssrsvZ kubelet: E0119 11:40:13.074936 4030 docker_sandbox.go:267] Failed to stop sandbox “62481fabdbfcf662du094bf9514fc631c5703a1f676skd17585651069ca09ed2084”: operation timeout: context deadline exceede.原创 2021-02-04 10:48:23 · 798 阅读 · 0 评论