转载请注明出处:http://blog.csdn.net/fishle123/article/details/48895927
本文主要介绍HTTP消息,包括HTTP请求/响应格式,以及HTTP消息头。
HTTP:超文本传输协议(Hypertext Transfer Protocol)
HTTP的发展是万维网协会(World Wide Web Consortium)和Internet工作小组(Internet Engineering Task Force)合作的结果,(他们)最终发布了一系列的RFC,其中最著名的就是RFC 2616。RFC 2616定义了HTTP协议的我们今天普遍使用的一个版本——HTTP 1.1。
HTTP是一个基于TCP/IP的应用层协议。对于从客户端的每一个HTTP请求,都会经历4个步骤:
1)建立一个到服务器指定端口(默认是80端口)的TCP连接,当然,可以在URL中指定其他的端口
2)客户端向服务器发送消息
3)服务器向客户端发送响应
4)服务器关闭连接
在HTTP1.1及后续版本中,可以通过一个TCP连接发送多个请求和响应。也就是在执行4)之前,2)和3)可以执行多次。
1 HTTP请求与响应
HTTP请求由4部分组成,分别是:请求行、消息报头、一个空行,以及请求正文。一般的客户端请求如下:
GET http://www.qq.com/ HTTP/1.1
Accept: */*
Accept-Language: zh-CN
User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0E; .NET4.0C)
Accept-Encoding: gzip, deflate
Connection: Keep-Alive
Host: www.qq.com
Cookie: ts_refer=www.hao123.com/;
像这样的GET请求不包含消息体,所以请求一个空行结束。
请求行以一个方法符号开头,以空格分开,后面跟着请求的URI和协议的版本,格式如下:
Method Request-URI HTTP-Version CRLF
其中 Method表示请求方法;Request-URI是一个统一资源标识符;HTTP-Version表示请求的HTTP协议版本;CRLF表示回车和换行(除了作为结尾的CRLF外,不允许出现单独的CR或LF字符)。
请求方法(所有方法全为大写)有7种,各个方法的解释如下:
GET 请求获取Request-URI所标识的资源
POST 在Request-URI所标识的资源后附加新的数据
HEAD 请求获取由Request-URI所标识的资源的响应消息报头
PUT 请求服务器存储一个资源,并用Request-URI作为其标识
DELETE 请求服务器删除Request-URI所标识的资源
TRACE 请求服务器回送收到的请求信息,主要用于测试或诊断
OPTIONS 请求查询服务器的性能,或者查询与资源相关的选项和需求
HEAD方法与GET方法几乎是一样的,对于HEAD请求的回应部分来说,它的HTTP头部中包含的信息与通过GET请求所得到的信息是相同的。利用这个方法,不必传输整个资源内容,就可以得到Request-URI所标识的资源的信息。该方法常用于测试超链接的有效性,是否可以访问,以及最近是否更新。
在接收和解释请求消息后,服务器返回一个HTTP响应消息。
HTTP响应也是由三个部分组成,分别是:状态行、消息报头、一个空行,响应正文。一个典型的成功响应如下:
HTTP/1.1 200 OK
Server: JDWS/1.2.7
Date: Sat, 19 Sep 2015 04:37:16 GMT
Transfer-Encoding: chunked
Connection: close
dsp_1442637227614([{"pf":[],"pid":"11483650"},{"pf":[],"pid":"10066526"},{"pf":[],"pid":"11701869"},{"pf":[],"pid":"11583894"},{"pf":[],"pid":"1332825"},{"pf":[],"pid":"1593239771"}])
状态行格式如下:
HTTP-Version Status-Code Reason-Phrase CRLF
其中,HTTP-Version表示服务器HTTP协议的版本;Status-Code表示服务器发回的响应状态代码;Reason-Phrase表示状态代码的文本描述。
状态代码有三位数字组成,第一个数字定义了响应的类别,且有五种可能取值:
1xx:指示信息--表示请求已接收,继续处理
2xx:成功</