HTTP协议详解
Web浏览器与web服务器之间的一问一答的交互过程必须遵循一定的规则,这个协议就是HTTP协议
HTTP是hypertext transfer protocol(超文本传输协议)的简写,它是TCP/IP协议集中的一个应用层协协议,用于定义WEB浏览器与WEB服务器之间交换数据的过程以及数据本身的格式
HTTP协议的版本
HTTP/1.0 HTTP/1.1 HTTP-NG
深入理解HTTP协议,对管理和维护复杂的WEB站点、开发具有的特殊用途的WEB服务器程序具有直接影响
HTTP/1.0会话方式
四个步骤: 建立连接
发出请求信息
回送响应信息
关闭连接
支持代理
存在问题 加载图片多次发送请求 耗时
HTTP/1.1
特点:1、在一个TCP连接上可以传送多个HTTP请求和响应
2、多个请求和响应过程可以重叠进行
3、增加了更多的请求头和响应头
HTTP请求消息
请求消息的结构:一个请求行、若干消息头、以及实体内容,其中一些消息头和实体内容都是可选得,消息头和实体内容之间要用空格隔开
举例:GET/books/java.html HTTP/1.1 请求行
Accetp:*/*
Accept-Language:en-us
Connection:Keep-Alive
Host:localhost 多个消息头
Referer:http://localhost/links.asp
User-Agent:Mozilla/4.0
Accept-Encoding:gzip,deflate
一个空行
HTTP的响应消息
响应消息的结构:一个状态行、若干消息头、以及实体内容 ,其中的一些消息头和实体内容都是可选的,消息头和实体内容之间要用空行隔开。
空行标识消息头结束
HTTP消息--à其他细节
(1)响应消息的实体内容就是网页文件的内容,也就是在浏览器中使用查看源文件的方式所看到的内容。
(2)一个使用GET方式的请求消息中不能包含实体内容,只有使用POST、PUT和DELETE方式的请求消息中才可以包含实体内容。
(3)对于HTTP 1.1来说,如果HTTP消息中包括实体内容,且没有采用chunked传输编码方式,那么消息头部分必须包含内容长度的字段,否则,客户和服务程序就无法知道实体内容何时结束。
(4)在HTTP协议中,还可以使用简单的请求消息和响应消息,它们都没有消息头部分。简单的请求消息只能用于GET方式,且请求行中不用指定HTTP版本号。对于简单的请求消息,服务器返回简单的响应消息,简单的响应消息中只返回实体内容
HTTP消息头
(1)使用消息头,可以实现HTTP客户机与服务器之间的条件请求和应答,消息头相当于服务器和浏览器之间的一些暗号指令。
(2)每个消息头包含一个头字段名称,然后依次是冒号、空格、值、回车和换行符。
举例: Accept-Language: en-us
(3)消息头字段名是不区分大小写的,但习惯上将每个单词的第一个字母大写。
(4)整个消息头部分中的各行消息头可按任何顺序排列。
(5)消息头又可以分为通用信息头、请求头、响应头、实体头等四类。
(6)许多请求头字段都允许客户端在值部分指定多个可接受的选项,多个项之间以逗号分隔。
举例:Accept-Encoding: gzip, compress
(7)有些头字段可以出现多次,例如,响应消息中可以包含有多个“Warning”头字段。
请求行与状态行
请求行
格式:请求方式 资源路径 HTTP版本号<CRLF>
举例:GET /test.html HTTP/1.1
请求方式:POST、HEAD、OPTIONS、DELETE、TRACE、PUT
状态行
格式: HTTP版本号 状态码 原因叙述<CRLF>
举例:HTTP/1.1 200 OK
使用GET和POST方式传递参数
在URL地址后面可以附加一些参数
举例:http://www.it315.org/servlet/ParamsServlet?param1=abc¶m2=xyz
GET方式
举例:GET /servlet/ParamsServlet?param1=abc¶m2=xyz HTTP/1.1
特点:传送的数据量是有限制的,一般限制在1KB以下。
POST方式
举例:
POST /servlet/ParamsServlet HTTP/1.1
Host:
Content-Type: application/x-www-form-urlencoded
Content-Length: 28
param1=abc¶m2=xyz
特点:传送的数据量要比GET方式传送的数据量大得多 。
响应状态码
响应状态码用于表示服务器对请求的各种不同处理结果和状态,它是一个三位的十进制数。响应状态码可归为5种类别,使用最高位为1到5来进行分类,如下所示:
(1)100~199 表示成功接收请求,要求客户端继续提交下一次请求才能完成整个处理过程 。
(2)200~299 表示成功接收请求并已完成整个处理过程 。
(3)300~399 为完成请求,客户需进一步细化请求。例如,请求的资源已经移动一个新地址。
(4)400~499 客户端的请求有错误。
(5)500~599 服务器端出现错误。
响应状态码à典型情况
200(正常) 表示一切正常,返回的是正常请求结果。
206(部分内容) 客户发送了一个带有Range头(要求服务器只返回文档中的部分内容)的GET请求,服务器按要求完成了这个请求。
302/307(临时重定向) 指出被请求的文档已被临时移动到别处,此文档的新的URL在Location响应头中给出。
304(未修改) 表示客户机缓存的版本是最新的,客户机应该继续使用它。
401(未经授权) 表示客户机访问的是一个受口令和密码保护的页面,结合使用一个WWW-Authenticate响应头提示客户机应重新发出一个带有Authorization头的请求消息。
404(找不到) 服务器上不存在客户机所请求的资源。
500(内部服务器错误) 服务器端的CGI、ASP、JSP等程序发生错误。
通用信息头
通用信息头字段既能用于请求消息,也能用于响应消息,它包括一些与被传输的实体内容没有关系的常用消息头字段。
请求头
请求头字段用于客户端在请求消息中向服务器传递附加信息,主要包括客户端可以接受的数据类型、压缩方法、语言、以及发出请求的超链接所属网页的URL地址等信息。
响应头
响应头字段用于服务器在响应消息中向客户端传递附加信息,包括服务程序名,被请求资源需要的认证方式,被请求资源已移动到的新地址等信息。
实体头
实体头用作实体内容的元信息,描述了实体内容的属性,包括实体信息类型、长度、压缩方法、最后一次修改时间、数据有效期等。
扩展头
在HTTP消息中,也可以使用一些在HTTP 1.1正式规范里没有定义的头字段,这些头字段统称为自定义的HTTP头或扩展头,它们通常被当作是一种实体头处理。
现在流行的浏览器实际上都支持Cookie、Set-Cookie、Refresh和Content-Disposition等几个常用的扩展头字段。
Refresh头字段
Refresh: 1
Refresh: 1;url=http://www.it315.org
Content-Disposition头字段
Content-Type: application/octet-stream
Content-Disposition: attachment; filename=aaa.zip