02-网络为什么要分层

        当你听到什么二层设备、三层设备、四层LB和七层LB中层的时候,是否一头雾水,不知道这些所谓的层,对应的各种协议具体要做什么工作呢?

        在教科书中经常会有一个对网络为什么要分层有一个不是十分恰当的比喻:因为不同的层次之间有不同的沟通方式,这个叫作协议。例如一家公司也是分层次的,分总经理、经理、组长、员工。总经理之间有他们的沟通方式,经理和经理之间也有沟通方式,同理组长和员工也有自己的共同方式。

        那么第一个问题来了,经理在握手的时候,员工在干什么呢?很多人听过TCP建立连接的三次握手协议,那么TCP在进行三次握手的时候,IP层和MAC层对应有什么操作呢?

        学习第三层的时候会提到,IP协议里面包含目标地址和源地址。第三层往往还会学习路由协议。路由就像中转站,我们从原始地址A到目标地址D,中间经过两个中转站A-B-C-D,是通过路由转发的。

        那么第二个问题来了,A知道自己的下一个中转站是B,那从A发出来的包,应该把B的IP地址放在哪里呢?B知道自己的下一个中转站是C,从B发出来的包,应该把C的IP地址放在哪里呢?如果放在IP协议中的目标地址,那包到了中转站,怎么知道最终的地址是D呢?

        我们经常听说的二层设备、三层设备,二层设备处理的通常是MAC层的东西,那我发送一个HTTP的包,是在第七层工作的,那是不是不需要经过二层设备?或者即便经过了,二层设备也不处理呢?或者换一种说法,二层设备处理的包里,有没有HTTP层的内容呢?

        网络为什么要分层?

        因为是个复杂的程序都要分层。理解计算机网络中的概念,一个很好的角度是,想象网络包就是一段buff,或者一块内存,是由格式的。同时,想象自己是处理网络包的程序,而且这个程序可以跑在电脑上,可以跑在服务器上,可以跑在交换机上,也可以跑在路由器上。你想象自己有很多的网口,从某个口拿进一个网络包来,用自己的程序处理一下,再从另一个网口发出去。

        当然网络包的格式很复杂,这个程序也很复杂。复杂的程序都要分层,这是程序设计的要求。比如,复杂的电商还会分数据库、缓存层、Compose层、Controller层和接入层,每一层专注做本层的事情。

        程序是如何工作的?

        当一个网络包从一个网口经过的时候,你看到了,首先看看要不要请进来,处理一把。有的网口配置了混杂模式,凡是经过的,全部拿进来。

        拿进来以后,就要交给一段程序来处理,于是调用了process_layer(buffer)。当然,这是一个假的函数。但是你明白其中的意思,知道肯定是有这么个函数,那这个函数是干什么的呢?从Buffer中,摘掉二层的头,看一看,应该根据头里面的内容做些什么操作。

        假设你发现这个包的MAC地址和你的相符,那说明就是发给你的,于是调用process_layer3(buffer)。这个时候呀,Buffer里面往往就没有二层的头了,因为已经在上一个函数的处理过程中拿掉了,或者开始的偏移量移动了一下。在这个函数里面,摘掉三层的头,看看到底是发送给自己的,还是希望自己转发出去的。

        如何判断呢?如果IP地址不是自己的,那么就是转发出去的,如果IP地址是自己的,那就是发给自己的。根据IP头里面的表示,拿掉三层的头,进行下一层的处理,到底是调用process_tcp(buffer)呢,还是调用process_udp(buffer)呢?

        假设这个地址是TCP的,则会调用process_tcp(buffer),这个时候,Buffer里面没有三层的头,就需要产看四层的头,看这就是一个发起,还是一个应答,又或者是一个正常的数据包,然后分别由不同的逻辑进行处理。如果是发起或者应答,接下来可能要发送一个回复包;如果是一个正常的数据包,就需要交给上层了,交给谁呢?是不是有process_http(buffer)函数呢?

        没有的,如果你是一个网络处理包程序,你不需要有process_http(buffer),而是应该交给应用去处理。交给哪个应用呢?在四层的头里面有端口号,不同的应用监听不同的端口号。如果发现浏览器应用在监听这个端口,那你发给浏览器就行了。至于浏览器怎么处理,和你没有关系。

        浏览器自然会解析HTML,显示出页面来。电脑的主人看到页面很开心,就点了鼠标,点击鼠标的动作被浏览器捕获。浏览器知道,又要发起另一个HTTP请求了,于是使用端口号,将请求发给了你。

        你应该调用send_tcp(buffer),不用说,Buffer里面就是HTTP请求的内容。这个函数里面加一个TCP的头,记录下源端口号。浏览器会给你目的端口号,一般为80端口。

        然后调用send_layer3(buffer),Buffer里面已经有了HTTP的头和内容,以及TCP的头。在这个函数里面加一个IP的头,记录下源IP的地址和目标IP的地址。

        然后调用send_layer(buffer)。Buffer里面已经有了HTTP的头和内容、TCP的头,以及IP的头。这个函数里面要加一下MAC的头,记录下源MAC地址,得到的就是本机器的MAC地址和目标的MAC地址。不过,这个还要看当前知道不知道,知道就直接加上,不知道的话,就要通过一定的协议处理过程,找到这个MAC地址,反正要填一个,不能空着。

        万事俱备,只要Buffer里面的内容完整,就可以从网口发出去了,你作为一个程序的任务就算告一段落了。

        揭秘层与层之间的关系

        首先是分层的比喻,所有不能表示出层层封装含义的比喻,都是不恰当的。总经理握手不需要员工再吧,总经理之间谈什么,不需要员工直接参与吧,但是在网络世界不是这样的。真确的应该是,总经理之间沟通的时候,经理将总经理放在自己的兜里,然后组长把经理放自己兜里,员工把组长放自己的兜里,就像套娃娃一样。那员工直接沟通,不带上总经理,就不恰当了。

        在现实生活中,往往是员工说一句,组长补充两句,然后经理补充两句,最后总经理再补充两句。但是在网络世界中,应该是总经理说话,经理补充两句,员工再补充两句。

        在TCP三次握手的时候,IP层和MAC层在做什么呢?当然是TCP发送每一个消息,都会带着IP层和MAC层了。因为,TCP每发送一个消息,IP层和MAC层的所有机制都要运行一遍。而你只看到TCP三次我收了,其实,IP层和MAC层为此也忙活了很久了。

        这里要记住一点:只要是在网络上跑的包,都是完整的。可以有下层没有上层,绝对不可能有上层没下层。

        所以对TCP协议来说,三次握手也好,重试也好,只要想发出去包,就要有IP层和MAC层,不然是发布出去的。

        经常会有人问这样一个问题,我都知道那台机器的IP地址了,直接给他发消息呗,还要MAC地址干啥呢?这里的关键是没有MAC地址消息是发送不出去的。

        所以如果一个HTTP协议的包跑在网络上,它一定是完整的。无论这个包经过哪些设备,它都是完整的。

        所谓的二层设备、三层设备,都是这些设备上跑的程序不同而已。一个HTTP协议包经过一个二层设备,二层设备收进去的是整个网路包。这里面HTTP、TCP、IP、MAC都有。什么叫二层设备呢?就是指把MAC头摘下来,看看到底是丢弃、转发,还是自己留着。那什么叫三层设备呢?就是把MAC头摘下来之后,再把IP头摘下来,看看到底是丢弃、转发,还是自己留着。

        小结

        理解网络协议的工作模式,有两个小窍门:

        1-始终想象自己是一个处理网络包的程序:如何拿到网络包,如何根据规则进行处理,如何发出去;

        2-始终牢记一个原则:只要是是在网络上跑的包,都是完整测。可以有下层没上层,绝对不可能有上层没有下层。

        

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值