http通信过程
以访问www.baidu.com为例,请求其首页文件http://www.baidu.com/index.html
- 应用程序通过访问
/etc/resolv.conf
文件获得获得DNS服务器IP地址; - UDP模块添加源端口号和目的端口号,将DNS查询报文封装为UDP数据报;
- IP模块添加源IP地址和目的IP地址,将UDP数据报封装为IP数据报,查询路由表,(假设路由表没有缓存)将数据报发送至默认路由,由路由器进行转发;
- 由于此时ARP缓存中没有路由的MAC地址,所以发送端此时发起一个ARP广播查询路由器的MAC地址;
- 得到路由器MAC地址后,以太网驱动程序将IP数据报封装为以太网帧发送给路由器,此后发送数据不再需要调用ARP服务,ARP高速缓存中已经记录了路由器的地址映射关系。
IP数据报的源地址和目的地址在转发过程中从未改变,而以太网帧的头部的源地址和目的地址在转发过程一直在改变。
- 得到目的服务器的IP地址后,应用程序向服务器发送http请求报文;
1、2、3、建立TCP链接;
4、发送http请求
23、24、25、33、35、36、服务器返回数据
其余报文段为确认报文或者FIN报文
http请求
- 第一行:请求方法、目标资源URL(包含:协议、目标主机、资源文件名称)、协议版本;
- 第二行:客户端程序;
- 第三行:主机名;
- 第四行:链接维持方法。
其中2~4行为http头部字段,一个http请求可以有多个头部字段,可按任意顺序排列。
其中,HEAD,GET,OPTIONS,TRACE
方法不会对服务器产生修改,而POST,PUT,DELETE,PATCH
会影响服务器上的资源。
GET,HEAD,OPTIONS,TRACE,PUT,DELETE
等方法被视为等幂的。
http应答
- 第一行:状态行,包含协议版本、状态码、状态信息;
- 第2~7行:http应答头部字段,包含服务器程序名称、目标文档长度、文档的MINE类型、服务器返回的一个cookie、http应答再返回过程中经过的所有代理服务器的地址和名称。
- cookie是为了维护http协议的状态,因为http协议是无状态的,如果下一次的http请求需要上一次http请求的相关信息,客户端必须重传这些信息。使用cookie之后,cookie是服务器发送给客户端的特殊信息,客户端每次想服务端发送请求时需要带上这些信息,这样服务端就可以识别出不同的客户了。(基于浏览器的自动登录使用cookie实现)