![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Kubernetes
文章平均质量分 82
12Dong
这个作者很懒,什么都没留下…
展开
-
【Kubernetes】CronJob源码探寻
在我们线上环境,因为CronJob的数量太多(20074个CronJob),导致线上部分CronJob出现了延迟,甚至不再执行。从定性分析上,可以确认是CronJob数量太多导致,因为出现问题是在某一天增加了800 * 6 * 3 = 14400个CronJob之后,我发现原本应该当场执行的CronJob过了两天依然没有执行。现在需要定量确认导致这样现象原因是什么,才能通过某一种方案去优化他,可以通过调参解决?还是需要业务向技术妥协?找到具体做CronJob时间检查的操作 \kubernetes\pk原创 2020-08-11 20:53:58 · 259 阅读 · 0 评论 -
【Kubernetes】Prometheus关于内存使用的Metric
今天在翻Prometheus的时候,发现了一个Pod的内存使用居然和另外一个看板显示的不一致。通过查看Prometheus QL发现,两种指标所表示的含义不大一样。上面这张图所使用的Prometheus QL为sum by(container) (container_memory_usage_bytes{pod="istio-tracing-79cfbc6889-vm2vw", container=~".*", container!="POD", container!=""})经过Google一番后.原创 2020-07-14 22:16:39 · 1936 阅读 · 0 评论 -
【Kubernetes】CronJob 执行时间存在大量延迟
最近在迁移集群CronJob的时候,发现了一个问题:CronJob执行大概差了八个小时。当前的(指写文章)时间是5.18 19:36分,往前推45个小时,大概是5.16 22:36分,和我预设CronJob表达式子里写明的0 14 16 * * 16号14:00相差了八个小时。今天来研究一下这个小时究竟问题出在哪。从八个小时上来判断,正好是UTC +0 和 UTC +8的时差,也正好是我们的美国服务器和上海时间的时差。所以猜测上是集群设置时区的问题。查了一下文档,发现CronJob的执行时间是根据.原创 2020-05-18 20:19:40 · 1223 阅读 · 0 评论 -
【Kubernetes】通过Shell命令将一整个namespaces的crojob yaml转移到另一个集群
本文中我将通过shell命令将一整个namespaces的crojob 先制成yaml文件。解决这个问题的办法有很多,不一定要局限于我这一种,我的集群环境和当时的工具环境不一定和大多数人一样。先尝试了几种立马能想到的方法,如kubectl get cronjob -o yaml这种方法获取到的是一个cronjob列表,像下面这样:apiVersion: v1items:- apiVersion: batch/v1beta1 kind: CronJob metadata: crea原创 2020-05-15 19:27:11 · 270 阅读 · 0 评论 -
【Kubernetes】基于SpringBoot的Mutating Admission Webhook Server实现
背景注意事项思路过程背景公司内网的Kubernetes集群因为Istio sidecar的原因,经常会达到公司运维给我们组设置的资源上限。一个我们的业务服务通常由两部分容器组成,一个是我们真实对外服务的容器,另一个则是由Istio sidecar inject也就是Istio框架自动注入的Istio-sidecar。不提我们的业务容器,只针对Istio sidecar,他的resou...原创 2020-05-04 19:44:21 · 1147 阅读 · 2 评论 -
【Kubernetes】为服务开启Https设置
背景在使用kubernetes mutating webhook admission中,我为测验效果设置了如果不通过检查就无法部署的FailPolicy。遇到了如下问题:http: server gave HTTP response to HTTPS client经过一番google,发现是请求要求是HTTPS,返回却是HTTP这个错误的解决思路大概分两种,需要一一测试:服务内部的实...原创 2020-04-30 17:15:19 · 1352 阅读 · 0 评论 -
【Kuberneter】读阿里云原生实践项目考察
断路器 数据同步失败 用户无法登陆 流量转移到其他集群推动了 PaaS 层的面向终态自动化改造通过 智能调度与 PaaS 平台,让自动迁移应用,修复不稳定因素成为了可能应用yaml托管云原生应用管理工具云原生rocketmq节点发布回滚策略...原创 2020-02-17 23:42:29 · 292 阅读 · 0 评论 -
【Kubernetes】记一次在Kubernetes上发布的思考
昨天在填发布单子的时候,和前端约定第二天按前端进度决定能不能发布,先把单子填了。第二天被告知无法发布,那么就要把发布的分支上的代码回退到开发前的状态。但因为这次发布的分支上带有很多的新功能,所以回退起来有些麻烦。灵机一动,新提交一个分支把我这次发布的内容不暴露出去,代码先留着。那么就要从master分支上从拉一个新分支出来,这个分支应该和发布分支一样。但实际上不一样,原因是之前已经有同事回...原创 2019-10-17 11:01:08 · 152 阅读 · 0 评论 -
【Kubernete】CronJob 创建的Pod连接同集群内其他Pod的服务返回404
晚上发现,使用Kubernetes CronJob创建定时任务时,CronJob创建的实例发送HTTP请求到同集群内的其他服务,返回404。但第二天早上突然好了,非常神奇。以下是记录排查过程发现CronJob 无法访问其他服务实例,先试试是不是连不上网,这样可以去找运维处理。能ping通,那就是Kubernetes集群内部的问题。再试试,能不能ping通其他的node ip,… …嗯,也能...原创 2019-10-16 17:00:10 · 467 阅读 · 0 评论 -
【Kubernetes】k8s概念
Kubernetes学名是容器编排平台,我今天学习了一下,大概相关是多容器形成分布式的框架,为什么这么说呢,首先他是以容器组(Pods)为基本单位,以集群方式进行服务的。特点是,通过docker进行package(打包)、instantiate(实例化)、run(执行),以集群的方式运行、管理跨机器容器、解决Docker跨机器容器之间的距离,Kubernetes自我修复机制使得容器集群总是运行用户...原创 2018-06-21 07:30:32 · 251 阅读 · 0 评论