HTTP是 hypertext transfer protocol (超文本传输协议)的简写,它是 TCP/IP 协议集中的一个应用层协议,用于定义 WEB 浏览器与WEB 服务器之间交换数据的过程以及数据本身的格式。WEB浏览器与 WEB 服务器之间的一问一答的交互过程必须遵循一定的规则,这个规则就是 HTTP 协议。
HTTP协议的版本 :HTTP/1.0、 HTTP/1.1
一、HTTP 1.0的会话方式
浏览器与WEB 服务器的连接过程是短暂的,每次连接只处理一个请求和响应。对每一个页面的访问,浏览器与 WEB 服务器都要建立一次单独的连接。 浏览器到 WEB 服务器之间的所有通讯都是完全独立分开的请求和响应对。
四个步骤:
支持代理:
(1)HTTP 1.1的特点
在一个TCP 连接上可以传送多个 HTTP 请求和响应
多个请求和响应过程可以重叠进行
增加了更多的请求头和响应头
(2)HTTP1.0和 HTTP1.1 的区别
HTTP1.0 协议,客户端与 web 服务器建立连接后,只能获得一个 web 资源。
二、HTTP请求
HTTP协议的请求主要由一下几部分组成:请求行,请求头,请求体
-------------------------请求头格式------------------------------------------------------------------
HTTP请求行
(请求)头
空行
可选的请求体
1、请求行
请求行中的GET 称之为请求方式,请求方式有:
GET 检索URI中标识资源的一个简单请求
HEAD 与GET方法相同,服务器只返回状态行和头标,并不返回请求文档
POST 服务器接受被写入客户端输出流中的数据的请求
PUT 服务器保存请求数据作为指定URI新内容的请求
DELETE 服务器删除URI中命名的资源的请求
OPTIONS 关于服务器支持的请求方法信息的请求
TRACE Web服务器反馈Http请求和其头标的请求
CONNECT 已文档化但当前未实现的一个方法,预留做隧道处理
常用的有: GET 、 POST。用户如没有设置,默认情况下浏览器向服务器发送的都是get 请求,例如在浏览器直接输地址访问,点超链接访问等都是 get ,用户如想把请求方式改为 post ,可通过更改表单的提交方式实现。
不管POST 或 GET ,都用于向服务器请求某个 WEB 资源,这两种方式的区别主要表现在数据传递上:
(1)如请求方式为GET ,则可以在请求的 URL 地址后以 ? 的形式带上交给服务器的数据,多个数据之间以 & 进行分隔,如:
GET /mail/1.html?name=abc&password=xyz HTTP/1.1
GET方式的特点:在 URL 地址后附带的参数是有限制的,其数据容量通常不能超过 1K 。
(2)如请求方式为POST 方式,则可以在请求的实体内容中向服务器发送数据, Post 方式的特点:传送的数据量无限制。
请求头都是以key:value形式进行保存的,里面记录了客户端的一些基本信息,常用的请求头如下所示:
Accept: text/html,image/*
Accept-Charset: ISO-8859-1
Accept-Encoding: gzip,compress
Accept-Language: en-us,zh-cn
Host: www.it315.org:80
If-Modified-Since: Fri, 11 Dec 2015 18:23:51 GMT
Referer: http://www.it315.org/index.jsp
User-Agent: Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0)
Cookie
Connection: close/Keep-Alive
Host: search.cnipr.com
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.0; zh-CN; rv:1.9.1.13) Gecko/20100914 Firefox/3.5.13 ( .NET CLR 3.5.30729)
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: zh-cn,zh;q=0.5
Accept-Encoding: gzip,deflate
Accept-Charset: GB2312,utf-8;q=0.7,*;q=0.7
Keep-Alive: 300
Connection: keep-alive
三、HTTP响应
---------------------------响应头格式------------------------------------------------------------------
HTTP状态行
(应答)头
空行
可选的消息体
1、状态行
格式: HTTP 版本号 状态码 原因叙述 <CRLF>
举例:HTTP/1.1 200 OK
状态码用于表示服务器对请求的处理结果,它是一个三位的十进制数。响应状态码分为5 类,如下所示:
响应状态码典型情况
200(正常) 表示一切正常,返回的是正常请求结果。
302/307(临时重定向) 指出被请求的文档已被临时移动到别处,此文档的新的URL 在 Location 响应头中给出。
304(未修改) 表示客户机缓存的版本是最新的,客户机应该继续使用它。
403(禁止) 服务器理解客户端请求,但拒绝处理它。通常由于服务器上文件或目录的权限设置所致。
404(找不到) 服务器上不存在客户机所请求的资源。
500(内部服务器错误) 服务器端的CGI 、 ASP 、 JSP 等程序发生错误。
2、响应头
content-text:服务器发送信息的类型
date:发送时间
server:服务器类型
HTTP请求中的常用响应头
Location: http://www.it315.org/index.jsp
Server:apache tomcat
Content-Encoding: gzip
Content-Length: 80
Content-Language: zh-cn
Content-Type: text/html; charset=GB2312
Last-Modified: Fri, 11 Dec 2015 18:23:51 GMT
Refresh: 1;url=http://www.it315.org
Content-Disposition: attachment; filename=aaa.zip
Transfer-Encoding: chunked
Set-Cookie:SS=Q0=5Lb_nQ; path=/search
ETag: W/"7777-1242234904000"
Expires: -1
Cache-Control: no-cache
Pragma: no-cache
Connection: close/Keep-Alive
Date: Fri, 11 Dec 2015 18:23:51 GMT