HTTP 简介
客户端连上web服务器后,若想获得web服务器中的某个web资源,需遵守一定的通讯格式,HTTP协议用于定义客
户端与web服务器通迅的格式。
WEB浏览器与WEB服务器之间的一问一答的交互过程必须遵循一定的规则,这个规则就是HTTP协议。HTTP是hypertext transfer protocol(超文本传输协议)的简写,它是TCP/IP协议集中的一个应用层协议,
用于定义WEB浏览器与WEB服务器之间交换数据的过程以及数据本身的格式。
HTTP协议的版本HTTP/1.0、HTTP/1.1HTTP协议是学习JavaWEB开发的基石,不深入了解HTTP协议,就不能说掌握了WEB开发,更无法管理和维护一些复杂的WEB站点。深入理解HTTP协议,对管理和维护复杂的WEB站点、开发具有特殊用途的WEB服务器程序具有直接影响。
HTTP 1.0 的会话方式四个步骤:
浏览器与WEB服务器的连接过程是短暂的,每次连接只处理一个请求和响应。对每一个页面的访问,浏览器与WEB服务器都要建立一次单独的连接。浏览器到WEB服务器之间的所有通讯都是完全独立分开的请求和响应对。
支持代理:
HTTP1.0 和 HTTP1.1 的区别
在HTTP1.0协议中,客户端与web服务器建立连接后,只能获得一个web资源。HTTP1.1协议,允许客户端与web服务器建立连接后,在一个连接上获取多个web资源。使用telnet举例说明。安装IE浏览器插件HttpWatch,查看IE浏览器通过HTTP协议获取某个页面。
HttpWatch工具的使用•功能:监听和截获本地机器每次向服务器发送的http请求数据和服务器向本地机器返回的http响应数据。•下载后,直接双击下载文件安装即可。之后打开IE浏览器,选择“工具”→“浏览器栏”→“HttpWatch Professional”。•这样操作之后,就可以打开HttpWatch工具了。
HTTP 请求的细节 —— 请求行
请求行中的GET称之为请求方式,请求方式有:
•POST、GET、HEAD、OPTIONS、DELETE、TRACE、PUT
•常用的有: GET、 POST
•用户如没有设置,默认情况下浏览器向服务器发送的都是get请求,例如在浏览器直接输地址访问,点超链接访问等都是get,用户如想把请求方式改为post,可通过更改表单的提交方式实现。
不管POST或GET,都用于向服务器请求某个WEB资源,这两种方式的区别主要表现在数据传递上:
•如请求方式为GET方式,则可以在请求的URL地址后以?的形式带上交给服务器的数据,多个数据之间以&进行分隔,例如:
•GET /mail/1.html ?name=abc&password=xyz HTTP/1.1
•GET方式的特点:在URL地址后附带的参数是有限制的,其数据容量通常不能超过1K。
•如请求方式为POST方式,则可以在请求的实体内容中向服务器发送数据,Post方式的特点:传送的数据量无限制。
HTTP请求的细节——消息头
用于HTTP请求中的常用头
•Accept: text/html,image/*•Accept-Charset: ISO-8859-1•Accept-Encoding: gzip,compress•Accept-Language: en-us,zh-cn•Host: www.it315.org:80•If-Modified-Since: Tue, 11 Jul 2000 18:23:51 GMT•Referer: http://www.it315.org/index.jsp•User-Agent: Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0)•Cookie•Connection: close/Keep-Alive•Date: Tue, 11 Jul 2000 18:23:51 GMT
响应状态码 à 典型情况
200(正常)
表示一切正常,返回的是正常请求结果。
302/307(临时重定向)
指出被请求的文档已被临时移动到别处,此文档的新的URL在Location响应头中给出。
304(未修改)
表示客户机缓存的版本是最新的,客户机应该继续使用它。
403(禁止)
服务器理解客户端请求,但拒绝处理它。通常由于服务器上文件或目录的权限设置所致。
404(找不到)
服务器上不存在客户机所请求的资源。
500(内部服务器错误)
服务器端的CGI、ASP、JSP等程序发生错误。
HTTP 响应细节 —— 常用响应头
HTTP请求中的常用响应头
•Location: http://www.it315.org/index.jsp•Server:apache tomcat•Content-Encoding: gzip•Content-Length: 80•Content-Language: zh-cn•Content-Type: text/html; charset=GB2312•Last-Modified: Tue, 11 Jul 2000 18:23:51 GMT•Refresh: 1;url=http://www.it315.org•Content-Disposition: attachment; filename=aaa.zip•Transfer-Encoding: chunked•Set-Cookie:SS=Q0=5Lb_nQ; path=/search•ETag: W/"7777-1242234904000"•Expires: -1•Cache-Control: no-cache•Pragma: no-cache•Connection: close/Keep-Alive•Date: Tue, 11 Jul 2000 18:23:51 GMT
扩展头
在HTTP消息中,也可以使用一些在HTTP 1.1正式规范里没有定义的头字段,这些头字段统称为自定义的HTTP头或扩展头,它们通常被当作是一种实体头处理。现在流行的浏览器实际上都支持Cookie、Set-Cookie、Refresh和Content-Disposition等几个常用的扩展头字段。Refresh头字段
Refresh: 1
Refresh: 1;url=http://www.it315.org
Content-Disposition头字段
Content-Type: application/octet-stream
Content-Disposition: attachment; filename=aaa.zip
总结:
请求头
Accept:客户机通过这个头,告诉服务器,它支持哪些数据类型
Accept-Charset::客户机通过这个头,告诉服务器,它支持的编码
Accept-Encoding: 客户机通过这个头,告诉服务器,支持哪种数据压缩格式
Accept-Language: 客户机采用的是哪个语言
Host:客户机通过这个头,告诉服务器,想访问服务器哪台主机
If-Modified-Since:客户机通过这个头,告诉服务器,数据缓存的时间
Referer:客户机通过这个头,告诉服务器,客户机是从哪个页面来的(防盗链)
User-Agent: 说明客户机操作系统信息,以及浏览器信息
Cookie:客户机通过这个头,可以带点数据给服务器
Connection
响应头
Location:服务器通过这个头告诉浏览器去访问哪个页面,这个头通常配合302状态码使用
Content-Encoding: 服务器通过这个头告诉浏览器,回送的数据采用的压缩格式
Content-Length: 服务器通过这个头告诉浏览器,回送的数据的大小
Content-Type: 服务器通过这个头告诉浏览器,回送数据的类型
Last-Modified: 服务器通过这个头告诉浏览器,资源的最后修改时间
Refresh:服务器通过这个头告诉浏览器,定时刷新网页
Content-Disposition: attachment; filename=aaa.zip:服务器通过这个头告诉浏览器,以下载方式打开数据
ETag: W/"7777-1242234904000":缓存相关的头,为每一个资源配一个唯一的编号
Expires: 0
Cache-Control: no-cache
Pragma: no-cache 这三个头组合使用,让浏览器不要缓存数据