http协议
统一资源定位符(Uniform Resource Locator),简称URL,这就是人们俗称的网址。URL的格式和要素是什么,我举个例子。
URL格式
上图就是一个URL的基本格式,需要添加的是深蓝的线划的这个部分。
这个部分叫做查询字符串,引出两个知识点,分别是urlencode和urldecode,即url编码和url解码。
url编码是将特殊字符的每一个字节都转换成为16进制,然后从右到左,取4位(不足4位直接处理),每2位做一位。
这里就是将"+“转义成了"2b”。考虑到用户本身提交的数据中有2b,也会造成歧义,因此在对每一个字节进行转换后,需要在前面加上%表示紧跟其后的两个字符经过了url编码。
url解码就是其逆过程。
HTTP协议格式
HTTP协议格式就是协议的实现
用fiddler工具进行浏览器的抓包,抓取浏览器与服务器之间的通信数据
HTTP请求首行:请求方法丶URL丶协议版本
请求方法 | 功能 |
---|---|
GET | 获取资源 |
HEAD | 获得报文首部 |
POST | 传输实体主体 |
DELETE | 删除文件 |
OPTIONS | 询问支持的方法 |
TRACE | 追踪路径 |
LINK | 建立和资源之间的联系 |
CONNECT | 要求用隧道协议连接代理 |
UNLINE | 断开连接关系 |
PUT | 传输文件 |
URL:主要信息就是请求的资源路径以及提交的查询字符串
协议版本
协议版本 | 说明 |
---|---|
0.9 | 默认只支持GET请求方法,并且是短连接 |
1.0 | 支持了GET/HEAD/POST请求方法,并且支持长连接 |
1.1 | 支持了更多的请求方法,并且新增了更多的特性,实现管线化传输 |
2 | 支持服务端向客户端主动推送消息 |
头部: 空行的作用是间隔头部与正文
请求的属性, 冒号分割的键值对;每组属性之间使用\n分隔;遇到空行表示Header部分结束
正文: 空行后面的内容都是Body. Body允许为空字符串. 如果Body存在, 则在Header中会有一个Content-Length属性来标识Body的长度。
响应首行: 协议版本丶响应状态码丶状态码描述
首行
响应状态码 | 类别 |
---|---|
1xx | informational(信息性状态码) |
2xx | Success(成功状态码) |
3xx | Redirection(重定向状态码) |
4xx | Client Error (客户端错误状态码 ) |
5xx | Server Error (服务器错误状态码) |
头部:请求的属性, 冒号分割的键值对;每组属性之间使用\n分隔;遇到空行表示Header部分结束
正文: 空行后面的内容都是Body. Body允许为空字符串. 如果Body存在, 则在Header中会有一个Content-Length属性来标识Body的长度; 如果服务器返回了一个html页面, 那么html页面内容就是在body中。