大家好,我是博哥爱运维。在日常的K8S运维工作中,我们时常需要在pod内运行一些运维调试工具,抓取服务pod的流量来分析问题,但基于安全因素以及镜像大小考虑,通常容器内不会带有过多的软件包,这个时候就给我们运维排查带来的困难,没关系,博哥这节课就教大家怎么去解决这个问题。
我们利用nginx服务,以实战的形式来模拟演示一次在业务服务pod中利用tcpdump抓取80端口的流量包
使用k8s自带debug功能来分析pod的网络流量
注: 这里使用的k8s版本是 v1.27.5 , v1.20.4 以上版本应该都是可以支持的
# 给大家推荐一款开源的容器工具箱 https://github.com/nicolaka/netshoot
0. 创建测试用的nginx服务
kubectl create deployment nginx --image=nginx:1.21.6
kubectl expose deployment nginx --port=80 --target-port=80
1. 创建一个 nginx 的副本,生成一个新的pod(boge-debugger),并添加一个调试容器(nicolaka/netshoot)并附加到它
# kubectl -n default debug nginx-6f648b8457-dglgp -it --image=docker.io/nicolaka/netshoot --copy-to=boge-debugger
2. 新的debug用pod是没有任何label的
# kubectl -n default get pod boge-debugger --show-labels
3. 如果要引入流量,可以把生产的label加到这个debug的pod上面
# kubectl -n default label pods boge-debugger app=nginx # 添加label
4. 这时可以看到endpoints已经把这个debug的pod地址更新进来了
# kubectl describe endpoints nginx
5. 在debug的pod内使用tcpdump抓包
# tcpdump -nv -i eth0 port 80
6. 去掉label并删除debug的pod(注意查看下endpoints是否已经去掉了debug的pod,并观察业务日志,确认没问题再删除)
# kubectl -n default label pods boge-debugger app- # 去掉label
# kubectl describe endpoints nginx
# kubectl -n default delete pods boge-debugger