事情是这样的,有个客户找到我们要查看具体的日期和时间,而我们项目目前只显示了日期,我觉得这个修改很简单呐,于是就决定改完立刻部署上线让客户使用。
改代码是很简单呐, 但是部署一到关键时刻就出问题。
昨天在部署的时候又出现了问题,以前也遇到过很多问题,比如镜像仓库的存储不够了,或者没有配置环境变量,这些问题都会显示在日志里。
昨天出了问题,我还以为是上面两个问题,所以就看了存储看了环境变量,都有都够。
最近项目没有做过大的更新,只是解决了一些安全漏洞,对包的版本进行了升级,但是这个会导致部署失败吗?
不管了,先回滚代码,MD,不行!
那重新建立一个部署的管道吧,MD,还是不行!
那只能找support了,support抛来一个帮助文档,让我自己看看有没有解决方案;
最后又去跑Logs:
kubectl get pods -n test | grep -v Running
kubectl describe pod podname/podid -n namespace
错误是“Back-off restarting failed container”,于是我嗅着这个线索找到了众多网友的回答:
可是我的deployment.yaml文件长这样呀:
于是,我还是硬着头皮把Command加上了,结果还是不行呀!
最后的最后,大神发现是Nginx Node版本的问题,不能用lts呀,这个会升级,升级之后可能就不行了呀,
解决办法就是固定Node版本:
这个问题我从昨天下午5点搞到凌晨1点,搞了8个小时,上午又花了些时间,只想问一句,Log能不能给的更全面一些呢?
这些愚蠢的问题能不能一开始就能分析到位呢?!