从输入网址到返回页面中间的故事(详细)

1.域名解析成IP

        每个主机在网络中都是IP为标识的,IP才是主机在网络中的位置,域名只是为了方便用户记忆而已,这就要求浏览器能够识别域名并将其转化为对应的IP地址。

        所以浏览器会有一个DNS缓存,其中记录了一些域名与IP的对应关系,供浏览器快速查找需要的IP。但是这个DNS缓存不可能存下所有的域名-IP地址,何况IP地址有时候还会变化,因此当在浏览器DNS缓存中没有找到的时候,就要先向DNS服务器请求域名解析,DNS域名解析时用的是UDP协议。

        1.客户端从浏览器中输入www.baidu.com网站网址后回车,首先浏览器会查询浏览器本身的DNS缓存,一般只有几分钟的缓存,找到了就返回域名对应的IP;如果找不到,系统就会查询本地hosts文件和本地DNS缓存信息,如果找到了,就返回域名对应的IP;

        2.如果没有找到对应的域名解析记录,那么系统会把浏览器的解析请求,交给客户端本地设置的DNS服务器地址解析(称为Local DNS,LDNS),如果LDNS服务的本地缓存有对应的解析记录,就会直接返回IP地址;

        3.如果没有,LDNS会负责继续请求其他DNS服务器;此时就是外网的DNS服务器了,先是根域名服务器,根据浏览器得到的域名,根域名服务器看到.com,会返回.com的顶级域名服务器的ip给LDNS;然后LDNS通过顶级域名服务器的ip,找到了顶级域名服务器,.com顶级域名服务器看到了是找baidu.com一级域名服务器,就将其服务器的ip返回给LDNS;然后一层一层往下找,直到找到了www.baidu.com的DNS记录,并得到对应的IP地址,这时候LDNS会把找到的www.baidu.com的地址发送给客户端浏览器,并记录在缓存中,以便未来再次访问。

        4.客户端浏览器收到ip之后,就可以通过ip地址找到对应的web服务器了,即服务端主机;接下来就是三次握手建立连接了

2.与目的主机进行TCP连接(三次握手)

        得到域名对应的ip地址后,也就表示可以将数据送达到目的主机了,即可以向服务器发送http请求了,但是http是应用层协议,tcp是传输层,所以发送http请求之前,开始我们常说的三次握手。http请求是使用TCP进行传输的,可以保证可靠传输,并且有序。需要建立连接,才能进行数据传输。

        1.向目的主机发送TCP连接请求报文

              1.1该TCP报文中SYN标志为为1,产生一个随机数j,表示连接请求

              1.2该TCP报文通过获取的ip(DNS)找到服务器主机,然后获得MAC地址(ARP),通过网关,最终到达目的祖居。

        2.目的主机收到数据帧后,通过ip协议传输帧,再到TCP协议,封装成连接请求应答报文;

              2.1该报文中SYN标志为1,产生一个随机数k,ack标志为j+1,表示连接请求应答

              2.2请求应答报文通过接收到的源ip->Mac(arp)->网关,发送到我的主机。

        3.我的主机收到数据帧,通过ip协议传输帧,再到TCP协议,封装成请求确认报文

                      3.1 该请求确认报文通过目标ip->Mac(arp)->网关,发送到目的主机

                      3.2 请求确认报文的ack为k+1,比表示请求确认;

         4.目的主机接收到数据帧,连接建立完成

3.发送和接收数据

          建立连接之后,就可以发送数据了,即发送http请求

          以get方法为例:

                   1.浏览器向服务器发送get方法报文

                   2.该get方法报文通过ip->tcp->mac->网关->目标主机

                   3.目标主机收到数据帧,通过ip->tcp->http,http协议单元回应http协议格式封装好的HTML形式数据;

                   4.该HTML数据通过tcp->ip->mac->网关->我的主机

                   5.我的主机收到数据帧,通过ip->tcp->http->浏览器,以网页形式显示HTML

           3.1 http请求头详解

             Post请求是可以有请求体的,而get请求不能有请求体

                      格式:

                           1.请求首行

                           2.请求头信息

                           3.空行

                           4.请求体

             get请求

GET /hello/index.jsp HTTP/1.1
Host: localhost
User-Agent: Mozilla/5.0 (Windows NT 5.1; rv:5.0) Gecko/20100101 Firefox/5.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: zh-cn,zh;q=0.5
Accept-Encoding: gzip, deflate
Accept-Charset: GB2312,utf-8;q=0.7,*;q=0.7
Connection: keep-alive
Cookie: JSESSIONID=369766FDF6220F7803433C0B2DE36D98
-------------此处是空行------------,get没有请求体
 

GETGET请求,请求服务器路径为/hello/index.jsp,协议为http1.1
Host请求的主机名为loaclhost
User-agent显示用户系统版本和浏览器版本信息
Accept告诉浏览器,当前客户端可以接受的类型是文档类型,这里*/*表示什么都可以接受
Accept-language当前客户端支持的语言,可以在浏览器的工具选项中找到语言信息
Accept-encodeing支持的压缩格式,数据在网络上传递是,可能服务器会把数据压缩后发送
Accept-charset客户端支持的编码
Connection客户端支持的连接方式,保持一段时间连接,默认3000ms
Cookie会在请求中把上一次服务器响应中发送过来的cookie在请求中一并发送,Cookie最典型的应用是判定注册用户是否已经登录网站,用户可能会得到提示,是否在下一次进入此网站时保留用户信息以便简化登录手续,这些都是Cookie的功用。另一个重要应用场合是“购物车”之类处理。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Post请求

POST /hello/index.jsp HTTP/1.1
Accept: image/gif, image/jpeg, image/pjpeg, image/pjpeg, application/msword, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/x-ms-application, application/x-ms-xbap, application/vnd.ms-xpsdocument, application/xaml+xml, */*
Referer: http://localhost:8080/hello/index.jsp
Accept-Language: zh-cn,en-US;q=0.5
User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; InfoPath.2; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729)
Content-Type: application/x-www-form-urlencoded
Accept-Encoding: gzip, deflate
Host: localhost:8080
Content-Length: 13
Connection: Keep-Alive
Cache-Control: no-cache
Cookie: JSESSIONID=E365D980343B9307023A1D271CC48E7D
---------------------------此处为空行-----------------------
Keyword=hello
--------------------- 
 

Referer请求来自哪个页面,例如你在百度上点击链接到本页面,那么referer就是百度网址,如果你在浏览器中直接输入网址,那么就没有referer请求头了
Content-type表单的数据类型,说明会使用了url个编码数据;url编码的数据都是以%为前缀的,后面跟随两位16进制
Content-length请求体的长度,这里表示13个字节
Keyword=hello请求体的内容,hello是表单输入的数据,keyword是表单字段的名字

 

 

 

 

 

 

 

              3.2 http响应头详解

               1.格式

                响应首行;

                响应头信息;

                空行;

                响应体。

HTTP/1.1 200 OK
Server: Apache-Coyote/1.1
Content-Type: text/html;charset=UTF-8
Content-Length: 724
Set-Cookie: JSESSIONID=C97E2B4C55553EAB46079A4F263435A4; Path=/hello
Date: Wed, 25 Sep 2012 04:15:03 GMT

--------------------- 

http/1.1响应协议为HTTP1.1,状态码200,表示请求成功,ok对状态码的解释
Server服务器的版本信息
Content-type响应体使用的是utf-8编码
Content-length响应体为724字节
Set-cookie响应给客户端的cookie
Date响应的时间。这可能有会有8小时时差


 

 

 

 

 

 

 

3.2.1响应码

1XX  Informational(信息性状态码)接收的请求正在处理

2XX Success(成功状态码)请求正常处理完毕

3XX Redirection (重定向状态码)需要进行附加操作以完成请求

4XX Client Error (客户端错误状态码)服务器无法处理请求

5XX Server Error(服务器错误状态码)服务器处理请求出错

200请求成功,浏览器会把响应体内容显示在浏览器中
404请求的资源没有找到,说明客户端错误地请求了不存在的资源
500请求资源找到了,但是服务器内部出现了故障
302重定向,响应码为302时,表示服务器要求浏览器重新再发一个请求,服务器会发送一个响应头location,它指定了新的url地址
304

        当用户第一次请求index.html时,服务器会添加一个名为last-Modified响应头,这个头说明了index.html的最后修改时间,浏览器会把index.html内容,以及最后的响应时间缓存下来。

        当用户第二次请求index.html时,在请求中包含一个if-modified-since请求头,它的值就是第一次请求时服务器通过last-modified响应头发送给浏览器的值,即index.html最后的修改时间,if-modified-since请求头就是在告诉服务器,我这里浏览器缓存的index.html最后的修改时间是这个,您看看现在index.html最后修改的时间是不是这个,如果是,那就不用响应这个请求,我直接把缓存里的内容显示出来即可。服务器获取if-modified-since值,与index.html的当前最后修改时间对比,如果相同,服务器发送响应码304,表示index.html与上次浏览器缓存的相同,无需再次发送,浏览器显示自己缓存页面,如果不同,那么说明index.html已经进行了修改,服务器响应200

 

 

 

 

 

 

 

 

 

 

 

 

 

4.与目的主机断开TCP连接(四次挥手)

 

数据传输结束之后需要断开连接,与建立连接不同,断开连接需要多一次手,四次挥手。

    1.浏览器向目的主机发出连接结束报文,此时进入FIN WAIT状态;

             2.连接结束报文标志为FIN=1,并且产生随机数M

             3.TCP连接结束请求报文通过ip->Mac(arp)->网关->目的主机

    4.目的主机接收到报文通过ip->tcp 通过tcp协议单元回应结束应答报文

             5.结束应答报文中ack=M+1,表示收到结束请求,当前只是进行回应,因为目的主机可能还有数据要传,并不急着断开连接。

    6.等到服务器发送完所有数据后,目的主机向我的主机发出tcp连接结束请求报文;

              7.该报文FIN标志为1,并且产生随机数N,表示结束请求

              8.tcp结束请求报文通过ip->Mac(arp)->网关->我的主机

    9.我的主机收到数据帧,通过ip->tcp,tcp协议单元回应结束应答报文,此时进入TIME WAIT状态,因为不相信网络是可靠的,如果目的主机没收到,还能够重发结束应答报文

             10.该回应结束应答报文中的FIV标志为1,ack=N+1;表示结束应答,该tcp报文通过ip->Mac(arp)->网关->目的主机;目的主机关闭连接,如果TIME WAIT等待结束后,没有收到回复,说明目的主机连接正常关闭了,我的主机也关闭连接

    FIN WAIT 状态是主动发起请求时,等待确认消息;

    TIME WAIT 状态是收到结束请求后发送确认消息后等待是否需要重发;

为什么断开连接需要四次挥手?

     因为断开连接时,目的主机可以直接发送FIN+ACK应答报文,而当目的主机收到FIN后,可能还有数据要发,并不一定直接断开连接,所以先发送一次应答,告知我的主机接收到了连接结束请求。等确认所有数据都发完了,再发送FIN,同时等待我的主机应答,这里的FIN和ACK不能一起发送,因为可能还有数据要传输,所以需要四次。

 


原文:https://blog.csdn.net/huangwei18351/article/details/81456228 
 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值