当你在浏览器输入一个网址点击回车后发生的鬼故事

通常上网时输入购物网站的网址后,点一下回车一个五彩缤纷的网页就出现了,这时一般人能将讲的鬼故事就是自己的钱是怎么没的。不过作为IT人,除了要清楚钱是怎么没的,同时还是应该了解一下在二进制世界发生的事。

以下按步骤描述一下大体的过程:

1.打开浏览器输入URL,点击回车后,你的主机首先会去查找URL对应的IP地址,毕竟实际定位通信靠IP而不是URL。先在本地解析列表中查找,如果找不到,再根据定义的DNS服务器逐个查找,如果都找不到就死在万里长征的第一步了...

2.找到对应的IP地址后,应用层开始将请求的内容打包,目前基本上都使用https了,所以加https报文头。

3.应用层打包完成后,向下传递到传输层。传输层发现这是浏览器应用打好的包,应该使用TCP封装(此处如果之前没有到目标的TCP连接存在,则要先进行三次握手建立连接,由于握手过程中不能携带数据,实际的https请求的数据是在连接建立后才发送过去的,这里假设连接已经建立,开始发送实际数据),在传输层会加TCP报文头,包括源端口为你的浏览器监听的端口号,目的端口为你访问的URL对应的端口(https默认为443)

4.传输层封装完成后,向下传递到网络层。网络层会根据DNS查找到的IP地址进行封装,加IP报文头,包括源IP地址为你的主机的IP地址,目标IP地址为URL的IP地址。

5.网络层封装完成后,向下传递到数据链路层。一般情况下你的主机都是处于内网的,通过本地路由表,能找到匹配的规则也基本都是到默认网关的,无法直接找到远在云端的网站服务器(私网地址无法直接和公网地址通信),所以此处会加MAC报文头,包括源MAC地址为本地网卡的MAC地址,目的MAC地址为网关的MAC地址。(一般情况下本地ARP都会缓存网关的地址信息,如果不幸没有的话,则进行ARP请求,这时通信基本靠吼,在内网喊一声这个IP地址对应的MAC地址是多少,它听见了自然会回应给你)

6.上述所有层封装完成后,来到物理层。这时会通过网卡将包发送至网关。此时整个包的内容如下:

   应用层:   https头(打包请求的内容及其他相关信息)

   传输层:   TCP头(源端口:你的浏览器监听的端口号(内网地址的端口号),目的端口:你访问的URL对应的端口号(公网地址的端口号),以及该层的其他内容)

   网络层:   IP头(源IP地址:你的主机的IP地址(内网地址),目标IP地址:URL的IP地址(公网地址),以及该层的其他内容)

   链路层:   MAC头(源MAC地址:你的主机的网卡MAC地址,目的MAC地址:本地网关的MAC地址,以及该层的其他内容)

7.到达网关后,网关查看MAC地址确认是发给自己的,将MAC头解包,发现目的IP地址在远端,网关会根据自己学习到的路由信息,选择下一跳的地址,此时网关重新在链路层组装该包,加新的MAC报文头,此时MAC报文头包括源MAC地址为本地网关的MAC地址,目的MAC地址为下一跳网关的MAC地址。

   这里有一种常见的情况,就是内网发到公网的包会做NAT地址转换,一来是因为IPv4地址不够同时也比较贵,二来内网主机不会直接暴露在公网,一定程度上保证了安全,通常是NAPT。经过转换后数据包中已经不包含内网的相关信息,可以在公网中流转了(PS:NAPT只修改源(目的)IP地址和源(目的)端口号,与MAC地址的修改无关,而NAT不会修改源端口因为他们是一一对应的)经过NAPT转换后的包内容如下:

   应用层:   https头(打包请求的内容及其他相关信息)

   传输层:   TCP头(源端口:源网关NAPT的端口号(公网地址的端口号),目的端口:你访问的URL的端口号(公网地址的端口号),以及该层的其他内容)

   网络层:   IP头(源IP地址:源网关NAPT的IP地址(公网地址),目标IP地址:URL的IP地址(公网地址),以及该层的其他内容)

   链路层:   MAC头(源MAC地址:源网关的MAC地址目的MAC地址:下一跳网关的MAC地址,以及该层的其他内容)

 8.数据包从本地网关出去后,途中可能经过多次路由,每经过一次路由就会修改包的MAC头部分,将源MAC地址改为当前路由器的地址,目的MAC地址改为下一跳路由器的MAC地址。

 9.到达目的IP地址所在网关后,可能还会做一次NAT或者NAPT,NAPT转换后再发送给对应内网IP主机。此时包的内容如下:   

   应用层:   https头(打包请求的内容及其他相关信息)

   传输层:   TCP头(源端口:源网关NAPT的端口号(公网地址的端口号),目的端口:你访问的URL对应的NAPT内网主机端口号(内网地址端口号),以及该层的其他内容)

   网络层:   IP头(源IP地址:源网关NAPT的IP地址(公网地址),目标IP地址:URL的对应的NAPT内网主机IP地址(内网地址),以及该层的其他内容)

   链路层:   MAC头(源MAC地址:目标网关的MAC地址目的MAC地址:目标内网主机的网卡MAC地址,以及该层的其他内容)

10. 包到达指定目标服务器后,这个服务器可能还不是具体提供服务的主机,而是一个负载均衡器(LB),LB解开MAC头,发现IP地址是自己的,就不再转发了,开始对IP头进行解包处理,这时得到传输层TCP头中的端口号。继续处理数据报文前,该LB主机会向你的主机反馈一个TCP报文接收确认包(如果此处没有反馈,或者反馈包中途丢失,则过了TCP的超时等待时间,你的主机会再次发送一遍该数据包,当然这是传输层自动进行的处理,并不需要你去再次点击浏览器)。回到LB主机上,这里已经获得了应用的端口号,如果是4层LB的话,此时就可以根据定义的4层规则,将包转发至具体提供服务的主机上,比如一台Nginx主机。如果是7层LB的话,还需要分析https头的信息,获取要访问的URL,再根据定义的7层规则转发。

11.包最终来到应用服务器,假设是一台Nginx主机,层层解包,找出对应的端口号是本地Nginx监听的端口号,则将包交给Nginx进程进行处理,如果访问的内容是一个静态页面或者访问的内容本地有缓存的情况下,则直接将内容打包反馈到你的主机。(可能按原路返回,也可能不是)(由于MTU限制,可能还会产生分片)。如果是动态页面的话,应用服务器还需要使用连接池的中的连接到数据库里去查查改改什么的,然后再连同数据库返回的内容一起打包。当然如果是数据库更新操作的话,还涉及很多东西,比如写undo log、redo log、主从同步什么的,东西太多了,都可以再写一篇文章了......

12.等到目标主机将所有需要的包发送回来时,你的主机会将这些包组装好,最后以一个五彩缤纷(也可能不是,取决于个人审美)的页面展现在电脑屏幕上。

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值