Docker网络实现

一、Docker网络

众所周知,Docker使用了Linux的Namespaces技术来进行资源隔离,如PID Namespace隔离进程,Mount Namespace隔离文件系统,Network Namespace隔离网络等。一个Network Namespace提供了一份独立的网络环境,包括网卡、路由、Iptable规则等都与其他的Network Namespace隔离。一个Docker容器一般会分配一个独立的Network Namespace。但如果启动容器的时候使用host模式,那么这个容器将不会获得一个独立的Network Namespace,而是和宿主机共用一个Network Namespace。容器将不会虚拟出自己的网卡,配置自己的IP等,而是使用宿主机的IP和端口。

1、网络命名空间

docker使用namespace实现容器网络隔离,但是我们使用ip netns命令却无法在主机上看到任何network namespace,这是因为默认docker把创建的网络命名空间链接文件隐藏起来了。

有2种进入这个“空间”的命令,我们以前的课都讲过。

1.1 通过ip netns exec

启动一个容器

docker run -tid ubuntu:18.04

这个时候,查询 network namespace,却发现是空的。

因为 ip netns 是去检查 /var/run/netns 目录的。而Docker这个软件,故意把容器对应的ns信息记录到了 /var/run/docker/netns 目录。所以ip netns查出来就是空的,我们想办法把ns信息翻出来就行。

(1)恢复关联-方式1

所以我们,把这2个目录关联一下:

ln -s /var/run/docker/netns  /var/run/netns

接下来再敲:

ip netns

就可以看到容器的 network namespace 了。

不过可以发现列出来的ns的ID,和对应容器的ID,不是同一个。 它两有一个映射值,可以通过 docker inspect 的结果查到对应关系:

docker inspect 070044b2738f

(2)恢复关联-方式2

找到容器主pid:

pid=$(docker inspect -f '{{.State.Pid}}' ${container_id})

创建对应的ns记录:

mkdir -p /var/run/netns/
ln -sfT /proc/$pid/ns/net /var/run/netns/$container_id

 1.2  通过 nsenter

找到容器里app的主pid。

docker inspect ecf8689d3297

 跑到这个pid对应的世界(namespace)里去。

nsenter -n -t 25977

这个时候,就是在容器里面的网络空间角度敲命令啦。

例如:

(1)查询网卡:ifconfig

(2)抓包:

tcpdump -i eth0 -n

2、docker网络模式

docker网络常见模式(5种)

  • bridge:这是Docker默认的网络驱动,此模式会为每一个容器分配Network Namespace和设置IP等,并将容器连接到一个虚拟网桥上。如果未指定网络驱动,这默认使用此驱动。
  • host:容器不会虚拟自己的网卡,直接使用宿主机的ip和port,使用--net=host指定。
  • none:容器有独立的Network namespace,但并没有对网络进行任何设置,如分配veth pair和网桥连接;采用了none 模式,那么就只能使用loopback网络设备,容器只能使用127.0.0.1的本机网络;查看容器网络设置,其值都是no。
  • container: 新创建的容器不会创建自己的网卡、配置ip,而是和指定的容器共享IP、端口范围。

启动容器时指定网络模式:

  • bridge模式:使用–net =bridge 指定,默认设置;
  • host模式:使用–net =host 指定;
  • none模式:使用–net =none 指定;
  • container模式:使用–net =container: 容器名称或容器ID 指定;

安装docker后,查看网络模式,默认的有三个:

1)bridge模式

在bridge模式下,Docker Daemon第1次启动时会在主机上创建一个名为docker0的虚拟网桥,此主机上启动的Docker容器会连接到这个虚拟网桥上,然后按照RPC1918的模型在私有网络空间中选择一个和宿主机不同的IP地址和子网分配给docker0,连接到docker0的容器就从这个子网中选择一个未占用的IP使用。如一般Docker会使用172.17.0.0/16这个网段,并将172.17.42.1/16分配给docker0网桥,针对由Docker创建的每一个容器,都会创建一个虚拟的以太网设备(Veth设备对),其中一端关联到网桥上,另一端使用Linux的网络命名空间技术,映射到容器内的eth0设备,然后从网桥的地址段内给eth0接口分配一个IP地址。

第二幅图,是宿主机上查看ip配置的相关结果,我们可以看到有个docker0,通过图1,我们就可以简单的理解:容器<—>docker0网络<—>宿主机ens33网络之间的关系,所以,容器间的网络交互,都是通过docker0网络间接实现的。

网桥模式下,Docker将veth pair设备的一端放在新创建的容器中,并命名为eth0,另一端放在主机中,以veth65f9这样类似的名字命名,并将这个网络设备加入到docker0网桥中,可以通过brctl show命令查看。

补充知识点:veth pair设备对,在创建时都是成对的,是一种Linux虚拟设备,相当于一根“网线”,两端可以连接不同设备,一端产生的数据会复制到另一端。

docker0默认网段为172.0.0.1/16,如果要修改默认网段如下:

停止所有容器
docker rm $(docker ps -a -q)

停止docker
systemctl stop docker

对daemon.json添加如下内容:
修改/etc/docker/daemon.json(daemon.json没有就新建)文件,加入以下代码
{
    "default-address-pools":[
        {"base":"172.30.0.0/16","size":24}
    ]
}

重新加载配置,并启动docker:
systemctl daemon-reload
Systemctl start docker

例举:

在bridge模式下,连在同一网桥上的容器可以相互通信(若出于安全考虑,也可以禁止它们之间通信,方法是在DOCKER_OPTS变量中设置--icc=false,这样只有使用--link才能使两个容器通信)。

容器也可以与外部通信,我们看一下主机上的Iptable规则,可以看到这么一条

-A POSTROUTING -s 172.17.0.0/16 ! -o docker0 -j MASQUERADE

这条规则会将源地址为172.17.0.0/16的包(也就是从Docker容器产生的包),并且不是从docker0网卡发出的,进行源地址转换,转换成主机网卡的地址。这么说可能不太好理解,举一个例子说明一下。假设主机有一块网卡为eth0,IP地址为10.10.101.105/24,网关为10.10.101.254。从主机上一个IP为172.17.0.1/16的容器中ping百度(180.76.3.151)。IP包首先从容器发往自己的默认网关docker0,包到达docker0后,也就到达了主机上。然后会查询主机的路由表,发现包应该从主机的eth0发往主机的网关10.10.105.254/24。接着包会转发给eth0,并从eth0发出去(主机的ip_forward转发应该已经打开)。这时候,上面的Iptable规则就会起作用,对包做SNAT转换,将源地址换为eth0的地址。这样,在外界看来,这个包就是从10.10.101.105上发出来的,Docker容器对外是不可见的。

那么,外面的机器是如何访问Docker容器的服务呢?我们首先用下面命令创建一个含有web应用的容器,将容器的80端口映射到主机的80端口。

docker run -d --name web -p 80:80 fmzhen/simpleweb

然后查看Iptable规则的变化,发现多了这样一条规则:

-A DOCKER ! -i docker0 -p tcp -m tcp --dport 80 -j DNAT --to-destination 172.17.0.5:80

此条规则就是对主机eth0收到的目的端口为80的tcp流量进行DNAT转换,将流量发往172.17.0.5:80,也就是我们上面创建的Docker容器。所以,外界只需访问10.10.101.105:80就可以访问到容器中得服务。

除此之外,我们还可以自定义Docker使用的IP地址、DNS等信息,甚至使用自己定义的网桥,但是其工作方式还是一样的。

2)host模式
定义:容器将不会获得一个独立的Network Namespace, 而是和宿主机共用一个Network Namespace。容器将不会虚拟出自己的网卡而是使用宿主机的IP和端口。
直接使用宿主机的 IP 地址与外界进行通信,不再需要额外进行NAT 转换。

我们启动容器时选择这种模式,是无需指定端口映射的,因为使用的就是宿主机的端口和网络
所以,命令可以这么写:

docker run -d --network host --name tomcat83 billygoo/tomcat8-jdk8

访问方式:http://宿主机IP:8080/
因为tomcat的默认端口是8080
就可以简单的理解为,直接在宿主机上启动了一个tomcat,用的就是宿主机的网络。每创建一个容器,宿主机查看网络状态,就会多一个该容器端口的进程。

3)none模式

none模式在使用时,Docker容器会拥有自己独立的Network Namespace,但是,并不会为Docker容器进行任何网络配置。也就是说,容器内没有网卡等信息,需要自己手动配置网卡信息。

cat /etc/sysconfig/network-scripts/ifcfg-ens3
# Generated by dracut initrd
NAME="ens3"
DEVICE="ens3"
OnBOOT="yes"
NETBOOT="yes"
UUID="82eebe16-4fc7-4de7-aff9-dafc78e97773"
IPV6INIT="yes"
BOOTPROTO="dhcp"
TYPE="Ethernet"
PROXY_METHOD="none"
BROWSER_OnLY="no"
DEFROUTE="yes"
IPV4_FAILURE_FATAL="no"
IPV6_AUTOCOnF="yes"
IPV6_DEFROUTE="yes"
IPV6_FAILURE_FATAL="no"

4)、container模式
定义:新建的容器和已经存在的一个容器共享一个网络ip配置而不是和宿主机共享。新创建的容器不会创建自己的网卡,配置自己的IP,而是和一个指定的容器共享IP、端口范围等。同样,两个容器除了网络方面,其他的如文件系统、进程列表等还是隔离的。两个容器的进程可以通过lo网卡设备(127.0.0.1)通信。

这个模式的案例,无法使用tomcat镜像来演示
因为,tomcat启动默认端口是8080
于是,你两个容器公用一套网络端口,会导致端口冲突。
就简单的理解为,一台服务器上启动两个tomcat,都是8080端口,当然会报错冲突。

案例:

docker run -it                             --name alpine1  alpine /bin/sh
docker run -it --network container:alpine1 --name alpine2  alpine /bin/sh

alpine1容器内部:

alpine2容器内部:

由上面两幅图,可以看出,这两个容器,公用一个IP。
这种模式情况下,当alpine1容器被停止后
alpine2容器的网络将丢失,就等价于none模式,没有自己的IP网络可用了。

5)、自定义网络模式
使用场景:
规划容器网络,我们根据自己的设计,创建对应的docker网络,然后,在启动容器时,指定这个网络,这样,就可以把N多的容器网络,进行网段划分,方便管理容器。
当容器被重启时,对应的容器IP可能会发生变化,所以,我们在实际中使用的时候,会采取服务名进行互相调用,这样,无论容器IP如何变化,都不会影响服务互相调用。

而这个时候,我们用模式1的情况下,ping 容器名,是无法ping通的,所以,这种情况,通过容器名无法互相访问。

这个时候,自定义网络就体现出它的作用了!!!

创建自定义网络:

docker network create pzj_network

创建容器实例的时候,使用自己创建的网络:

docker run -d -p 8081:8080 --network pzj_network  --name tomcat1 billygoo/tomcat8-jdk8
docker run -d -p 8082:8080 --network pzj_network  --name tomcat2 billygoo/tomcat8-jdk8

进入tomcat1容器,ping tomcat2

进入tomcat2容器,ping tomcat1

会发现,此时,可以通过容器名,进行互相ping通。

这样就做到了,容器和IP解耦,服务间可以通过容器名进行互相访问。

原文链接:https://blog.csdn.net/Brave_heart4pzj/article/details/126561330

二、容器是如何访问外网的?

docker 容器通常是网桥的模式,容器通过veth pair对连接到网桥,连接到容器一端名称为eth0,连接到docker0网桥一端通常为veth*,veth网卡对可以理解成一个管道。一端连接网桥,一端连接到容器里面,这样容器出去的流量就可以进入网桥了。

当进入网桥后毕竟还是主机上,这个容器内部IP如何和外部通信呢?由于外部网络无法识别内部IP,所以需要将内部IP映射成宿主机的IP。还记得之前的文章介绍了SNAT原理嘛。这里Docker也是通过SNAT,将容器IP映射成主机IP。

可以看到容器出去 172.16.1.8 的源IP,在第2步被修改成主机的 10.0.0.1 后,发送到外部网络,然后返回的数据包的目的IP 就是 10.0.0.1 ,经过第4 步,反向SNAT ,将目的IP 10.0.0.1 再改成172.16.1.8,发送到容器里面。

我们可以看到docker0的实现,通过iptables 的MASQ(动态SNAT) 实现。

-A POSTROUTING -s 172.16.0.0/16 ! -o docker0 -j MASQUERADE

隧道网络打通所有容器

这种就稍微复杂一点,就是让所有容器处于同一个局域网中,全局管理各容器ip分配。
隧道模式,实现方式基本是各显神通了。除了新版本Docker有自己的实现,各大厂商也都有不一样的实现,比如现在各种flannel,weave,calico等现实。

K8S中通常使用flannel,weave,calico等现实这种模式。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值