![](https://img-blog.csdnimg.cn/20190927151132530.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
Kubernetes & Docker
文章平均质量分 64
本专栏主要涉及近些年对k8s集群运维的一些分享
ftzchina
这个作者很懒,什么都没留下…
展开
-
离线搭建Kubernetes(V1.13)集群
本次集群搭建采用比较流行的kubeadm方式,相比于二进制的安装配置kubernetes集群的方式,在流程上更加简单,因为省去了手工创建众多的配置文件,减少了很多出错的可能。kubeadm作为Kubernetes官方提供的集群部署管理工具,采用“一键式”指令进行集群的快速初始化和安装,极大地简化了部署过程,消除了集群安装的痛点。一:准备工作在安装前需规划好集群的网络及安装的版本,根据实际项目需要提前准备足够性能的服务器。本次搭建采用全离线安装的方式,需提前准备好集群...原创 2021-12-25 17:25:59 · 1057 阅读 · 0 评论 -
解决Kubernetes的flannel pod出现Init:RunContainerError问题
一:故障背景 我们有个k8s集群,一个master节点和三个Node节点,其中node2的节点ping不通node1节点的pod ip。需要排查一下为什么ping不通pod ip的问题。二:故障排查1,三板斧第一斧一般k8s的网络问题首先从网络组件开始查,本集群用的是flannel网络,在主节点上看看flannel的运行情况命令:kubectl get po -o wide -n kube-system有两个flannel的pod状态不对,处于Init:RunCo...原创 2021-12-23 10:59:11 · 3425 阅读 · 0 评论 -
编写dockerfile以及注意事项
一:什么是dockerfileDockerfile 是一个用来构建镜像的文本文件,文本内容包含了一条条构建镜像所需的指令和说明。另外在这里也提一下,制作docker镜像并不是只有dockerfile一条路,还可以通过docker commit命令,具体操作可自行去查找资料。二:dockerfile编写下面列出比较常用的指令1,FROM我们用dockerfile制作镜像,并不是从头开始也不是无中生有,而是在一个基础镜像上加入我们需要的内容重新生成一个新的镜像FROM...原创 2021-12-16 16:57:25 · 1091 阅读 · 0 评论 -
终极大招解决Kubernetes中docker文件系统挂死问题
在Kubernetes维护中发现,每隔一段时间都会出现docker挂死的问题,第一反应删掉该Pod重启一个也行,命令:kubectl delete po XXXX 但是docker文件系统在挂死的情况下,即使重启整个node节点也不行,甚至docker服务也起不来了,在网上找了各种资料,通过thin_repaire命令修复也还是不行。 经过实践,可以通过以下方法来修复(友情提醒,以下方法杀伤力比较大,慎重使用,由于会清空docker的数据,所以根据自...原创 2021-12-09 19:11:56 · 1114 阅读 · 0 评论 -
解决docker里升级python组件及删除文件都是问号的故障
近期需要对一个镜像进行更新,更新内容也很简单,就是对一个python组件进行升级,但是在操作的过程中碰到很多问题,在此分享一下解决问题的思路和方法 更新python组件常规操作就是先卸载然后pip install,但是执行卸载的时候就报错了,给出部分错误信息KeyError: 'No metadata except PKG-INFO is available'Installing collected packages: cryptography Found ex...原创 2021-09-28 19:20:37 · 1480 阅读 · 0 评论 -
Kubernetes调用API进行POD的增删改查
一:概述我们知道用Kubectl管理k8s的时候可以使用yaml文件,在这些配置文件的定义里面会有一个apiVersion字段,这个字段指明了要使用的API版本Kubernete API Server的核心功能主要是为Kubernetes的各类资源对象(如 node,pod,service等)提供了增、删、改、查以及watch的HTTP Rest接口。API server是集群中各个功能模块之间数据交互和通信的中心枢纽,除此之外它还有以下特性: ...原创 2021-08-30 17:10:38 · 1593 阅读 · 0 评论 -
Kubernetes证书过期的离线解决方案
一:证书过期原因默认使用kubeadm创建的集群其构成组件apiserver、controller-manager等证书默认只有一年的有效期,同时kubelet 证书也只有一年有效期,一年之后 kubernetes 将停止服务。官方推荐一年之内至少用 kubeadm upgrade 更新一次 kubernetes 系统,更新时也会自动更新证书。不过很多环境频繁更新 kubernetes 不太现实。网上大部分资料都是在线情况下进行证书延期操作,如果在不访问互联网的情况下,如何进行证书延期,现在很多生产环境原创 2021-05-22 10:49:13 · 2886 阅读 · 1 评论 -
docker的data文件过大问题
在维护k8s集群中发现有台NODE节点挂的概率很高,最后排查发现是docker的data文件(路径/var/lib/docker/devicemapper/devicemapper)过大,占满了/var的分区。在装系统的时候给该目录分的空间是100G,几乎全部被data占满了。Docker的数据默认是存放在/var/lib/docker下的,数据包括docker的镜像,容器以及运行时候的缓存数据。运维的过程发现当docker占满该分区后,整个节点会挂掉,机器会脱离k8s集群。一般这时候不想改变docke原创 2021-03-02 13:39:24 · 4690 阅读 · 0 评论