HTTP是一个属于应用层面向对象的协议,由于简捷,快速的方式,因此适用于分布式超媒体信息系统。
一、HTTP的历史版本
HTTP 0.9:1991年发布的第一个版本 ,只有一个命令GET,服务器只能回应HTML格式的字符串
HTTP 1.0:1996年发布的版本,内容量大大的增加,除了GET命令外,还引入了POST命令和HEAD命令。HTTP请求和回应的格式除了数据部分,每次通信还必须包括头信息,用来描述一些元数据
HTTP 1.1:1997年发布的版本,进一步完善了HTTP,直到它现在还是最流行的协议版本。
SPDY协议: 2009年谷歌公司为了解决HTTP1.1效率不高问题而自行研发的协议
HTTP2: 2015年新发布的版本SPDY(谷歌开发的基于TCP的会话层协议)的主要特性也在此版本中
二、HTTP的主要特点
- 支持C/S(客户/服务器)模式
- 简单快捷:客户向服务器请求服务时,只需传达请求方法和路径。请求方法常有的GET,HEAD,POST,每种方法规定了客户与服务器联系的类型不同。由于HTTP比较简单,这使得HTTP服务器程序规模小,因此通信速度很快。
- 灵活:HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
- 无连接:无连接的含义是现已每一次链接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,断开链接,采用这种方式可以节省传输时间
- 无状态:HTTP是无状态协议,无状态是指协议对事物处理没有记忆能力。缺少状态意味着如果后续处理前面的信息,则它必须重传,这样可能导致每次链接的数据量增大,而在服务器不需要先前信息时它的应答速度就很快。
HTTP URL的格式如下
http://host[":"port][abs_path]
host表示合法的Internet主机域名和IP地址;port指定一个端口号,为空则使用默认的80;asb_path指定请求资源的URI(web上任意的可用资源)
三、HTTP请求报文
HTTP报文是面向文本的,报文中每一个字段都是一些ASCLL码串,各个字段的长度是不确定的。一般一个HTTP请求报文由请求行,请求报头、空行、请求数据4个组成部分
1.请求行
请求行由方法、URL字段和HTTP版本组成的,格式如下
Method Request-URI HTTP-Version CRLF
其中,Method表示请求方法;Request-URI是一个统一资源标识符;HTTP-Version表示请求的HTTP版本;CRLF表示回车和换行(除了作为结尾的CRLF外,不允许出现单独的CR和LF字符)
HTTP请求方法有8种,分别是GET,POST,HEAD,PUT,DELETE,TRACE,CONNECT,OPTIONS。移动端开发最常用的就是GET和POST了。
- GET :请求获取Request-URI所表示的资源。
- POST:在Request-URI所标识的资源后附加新的数据
- HEAD:请求获取Request-URI所标识的资源响应消息报头
- PUT:请求服务器存储一个资源,并用Request-URI作为其标识
- DELETE:请求服务器删除Request-URI所标识的资源
- TRACE:请求服务器回送收到的请求信息,主要用于测试或诊断
- CONNECT:HTTP1.1协议中预留给能够将连接改为管道方式的代理服务器
- OPTIONS:请求查询服务器性能,或者查询与资源相关的选项和需求
2.请求报头
在请求行后会有0个或者多个请求报头,每个请求报头都包含一个名称和一个值,它们之间用冒号:分割。
3.请求数据
请求数据不在GET方法中使用,而在POST方法中使用。POST方法适用于需要客户填写表单场合,与请求数据相关的最常用的请求报头是Content-Type和Content-Length
四、HTTP响应报文
HTTP响应报文由状态行、响应报头、空行、响应正文组成。
1.状态行
状态行格式如下所示:
HTTP-Version Status-Code Reason-Phrase CRLF
其中,HTTP-Version表示服务器的HTTP版本,Statys-Code表示服务器发回的响应状态码;
Reason-Phrase(原因短语)表示状态码的文本描述,状态码由3位数字组成,第一个数字定义了响应类别,且有一下5种可能
- 100~199 指示信息,收到请求,需要请求者继续执行操作
- 200~299 请求成功 ,请求已被成功接受并处理
- 300~399 重定向 , 要完成请求必须进行更进一步的操作。
- 400~499 客户端错误 , 请求有语法错误或者请求无法实现
- 500~599 服务器错误,服务器不能实现合法的请求。
常见的状态码如下:
- 200 OK:客户端请求成功
- 400 Bad Request : 客户端请求有语法错误,服务端无法理解
- 401 Unauthorized:请求未经授权,这个状态码必须WWW-Authenticate报头域一起使用。
- 403 Forbidden : 服务器收到请求 , 但是拒绝提供服务
- 500 Internal Server Error : 服务器内部错误,无法完成请求
- 503 Server Unavailable:服务器当前不能处理客户端的请求,一段时间后回恢复正常
2.消息报头
消息报头分为通用报头 、请求报头 、 响应报头、实体报头、消息报头、由键值对组成。每行一对,关键字和值用英文冒号:分隔
- 通用报头
它既可以出现在请求报文中,也可以出现在响应报文中
- Date :表示消息产生的日期和时间
- Connection:允许发送指定链接的选项,列如指定连接是连续的;或者指定“close”选项,通知服务器,在响应完成后,关闭链接
- Cache-Control:用于指定缓存指令,指令是单向的(响应中出现的缓存指定在请求中未必会出现),且是独立的(一个消息的缓存指令不会影响另一个消息处理的缓存机制)
2.请求报头
请求报头通知服务器关于客户端请求的信息。
- Host : 请求的主机名,允许多个域名同一处IP地址,及虚拟机
- User-Agent:发送请求浏览器类型、操作系统等消息
- Accept:客户端可识别的内容类型列表,用于指定客户端接受那些类型的信息
- Accept-Encoding:客户端可识别的数据编码
- Accept-Language:表示浏览器所支持的语言类型
- Connection:允许客户端和服务器指令与请求/响应连接有关的选项。列如,这时为Keep-Alive,则保持链接
- Transfer-Encoding:告知接受端为了保证报文的可靠传输,对报文采用了什么编码方式
3.响应报头
用于服务器传递自身信息的响应,常见响应报头如下:
- Location : 用于重定向接受到一个新的位置 , 常用在更换域名的时候
- Service :包含服务器用来处理请求系统信息,与User-Agent 请求报头是相对的。
4.实体报头
用来定义被传送资源的信息,可用于请求,也可以用与响应,请求消息和响应消息都可以传送一个实体。
- Content-Type : 发送接受者实体正文媒体
- Content-Lenght:实体正文的长度
- Content-Language:描述资源所用的自然语言
- Content-Encoding:实体报头被用作媒体类型的修饰符。它的值指示了已经被应用到实体正文的附加内容的编码,因而要获得Content-Type报头域中所用的媒体类型,必须采用相应的解码机制
- Last-Meodified: 实体报头用于指示资源的最后修改日期和时间
- Expires:实体报头给出响应过期的日期和时间