首先了解http报文结构
简单归纳:
请求报文
在此使用fiddler抓包工具抓取一个请求包:
根据HTTP报文格式
请求行包括请求方法、URL、协议版本
图中显示这个请求包的请求行:
请求方法:GET
URL:http://baidu.com/
协议版本:HTTP/1.1
接下来是请求头部,请求头部一般是由头部字段名称、冒号、值 组成(由于HTTP报文是面向文本的报文中的字段都是由ascii码组成)
Accept: text/html, application/xhtml+xml, image/jxr, */*
Accept表示客户端可识别的响应内容类型列表
星号“*”用于按范围将类型分组 “*/*”指示可接受全部类型
Accept-Language: zh-Hans-CN, zh-Hans;q=0.5
Accept-Language:客户端可接受的自然语言
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36(KHTML, like Gecko) Chrome/51.0.2704.79 Safari/537.36 Edge/14.14393
User-Agent:产生请求的浏览器类型
Accept-Encoding: gzip, deflate
Accept-Encoding:客户端可接受的编码压缩格式
Host: baidu.com
Host:请求的主机名,允许多个域名同处一个IP 地址,即虚拟主机
Connection: Keep-Alive
Connection:连接方式(close 或 keepalive)
对于请求来说:close(告诉 WEB 服务器或者代理服务器,在完成本次请求的响应后,断开连接,不等待本次连接的后续请求了)。keepalive(告诉WEB服务器或者代理服务器,在完成本次请求的响应后,保持连接,等待本次连接的后续请求)
接下来全都Cookie字段了
fiddler中切换headers以一种更为直观的方式观看..
由于此处http包的请求方法是GET所以这个请求包没有包体
响应报文
响应报文结构
上述请求包的响应报文在fiddler中显示:
对于响应包的状态行:
协议版本:HTTP/1.1
状态码:302
301和302状态码都表示重定向,就是说浏览器在拿到服务器返回的这个状态码后会自动跳转到一个新的URL地址,这个地址可以从响应的Location首部中获取(用户看到的效果就是他输入的地址A瞬间变成了另一个地址B)——这是它们的共同点。他们的不同在于。301表示旧地址A的资源已经被永久地移除了(这个资源不可访问了),搜索引擎在抓取新内容的同时也将旧的网址交换为重定向之后的网址;302表示旧地址A的资源还在(仍然可以访问),这个重定向只是临时地从旧地址A跳转到地址B,搜索引擎会抓取新的内容而保存旧的网址。
状态码由三位数字组成,第一位数字表示响应的类型,常用的状态码有五大类如下所示:
1xx:表示服务器已接收了客户端请求,客户端可继续发送请求;
2xx:表示服务器已成功接收到请求并进行处理;
3xx:表示服务器要求客户端重定向;
4xx:表示客户端的请求有非法内容;
5xx:表示服务器未能正常处理客户端的请求而出现意外错误;
状态码描述:Moved Temporarily
响应包的响应头部更为清晰的观看方式..
Location:Location响应报头域用于重定向接受者到一个新的位置。例如:客户端所请求的页面已不存在原先的位置,为了让客户端重定向到这个页面新的位置,服务器端可以发回Location响应报头后使用重定向语句,让客户端去访问新的域名所对应的服务器上的资源;
Server:Server 响应报头域包含了服务器用来处理请求的软件信息及其版本。它和 User-Agent 请求报头域是相对应的,前者发送服务器端软件的信息,后者发送客户端软件(浏览器)和操作系统的信息。
Vary:指示不可缓存的请求头列表;
Connection:连接方式;
对于响应来说:close(连接已经关闭); keepalive(连接保持着,在等待本次连接的后续请求); Keep-Alive:如果浏览器请求保持连接,则该头部表明希望WEB 服务器保持连接多长时间(秒);例如:Keep-Alive:300;
WWW-Authenticate:WWW-Authenticate响应报头域必须被包含在401 (未授权的)响应消息中,这个报头域和前面讲到的Authorization 请求报头域是相关的,当客户端收到 401 响应消息,就要决定是否请求服务器对其进行验证。如果要求服务器对其进行验证,就可以发送一个包含了Authorization 报头域的请求;
空行:最后一个响应头部之后是一个空行,发送回车符和换行符,通知服务器以下不再有响应头部。
响应包体:服务器返回给客户端的文本信息;