HTTP协议
HTTP【超文本传输协议】简介
HTTP协议:WEB浏览器与WEB服务器之间的一问一答的交互过程必须遵循一定的规则
应用层协议,用于定义web浏览器与web服务器之间交换数据的过程以及数据本身的格式
HTTP协议的版本:
(1) HTTP/1.0
(2) HTTP/1.1
(3) HTTP-NG
HTTP/1.0:的会话方式:
浏览器与WEB服务器的连接过程是短暂的,每次连接只处理一个请求和响应。对每一个页面的访问,浏览器与WEB服务器都要建立一次单独的连接。
浏览器到WEB服务器之间的所有通讯都是完全独立分开的请求和响应对。
缺点:每个连接只负责一次应答多次连接断开
特点:支持代理
HTTP/1.1:
每个页面有一个自己的连接
特点:
1、在一个TCP连接上可以传送多个HTTP请求和响应[减少了多次建立连接的次数]
2、多个请求和响应过程可以重叠进行
3、增加了更多的请求头和响应头
HTTP请求消息
get请求要提交的内容会作为参数附加在URL地址后面GET/books/java.html?...=...&...=... HTTP/1.1
请求行与状态行
请求行:
格式:请求方式 资源路径 HTTP版本号<CRLF>
Eg:GET /test.html HTTP/1.1
状态行:
格式:HTTP版本号 状态号 原因叙述<CRLF>
Eg: HTTP/1.1 200 OK
请求头字段用于客户端在请求消息中向服务器传递附加信息,主要包括客户端可以接受的数据类型、压缩方法、语言、以及发出请求的超链接所属网页的URL地址等信息。
响应头字段用于服务器在响应消息中向客户端传递附加信息,包括服务程序名,被请求资源需要的认证方式,被请求资源已移动到的新地址等信息。
Age: 315315315//在客户端或代理服务器上缓存的时间
Location: http://www.it315.org/index.jsp (*)//资源相应的位置
Server: Microsoft-IIS/5.0 (*)//服务器版本
实体头用作实体内容的元信息,描述了实体内容的属性,包括实体信息类型、长度、压缩方法、最后一次修改时间、数据有效期等。
Allow: GET,POST//用于指定客户端提交请求的方式
Content-Encoding: gzip (*)//压缩时采用的编码方式
Content-Language: zh-cn (*)
Content-Length: 80 (*)//实体内容的长度,单位是字节数
Content-Location: http://www.it315.org/java_cn.html //内容的位置
Content-MD5: ABCDABCDABCDABCDABCDAB== //数字摘要,可以知道在传输的过程中内容有没有被修改
自定义的HTTP头或扩展头:在HTTP消息中,也可以使用一些在HTTP 1.1正式规范里没有定义的头字段,,它们通常被当作是一种实体头处理。
现在流行的浏览器实际上都支持Cookie、Set-Cookie、Refresh和Content-Disposition等几个常用的扩展头字段。
请求消息的结构:
一个请求行、若干消息头、以及实体内容,其中的一些消息头和实体内容都是可选的,消息头和实体内容之间要用空行隔开
get请求没有实体内容,因为要提交的信息已经作为参数附加在URL地址后面了
post请求有实体内容,要提交的信息作为实体内容出现
1、请求行 GET/books/java.html HTTP/1.1 [get是请求方法,books/java.html是请求资源,HTTP/1.1是请求遵循的版本]
2、多个消息头[消息头字段不区分大小写,顺序不固定] Accept:*/*
Accept-Language:en-us//客户端可以解压的消息的语言
Connection:Keep-Alive
Host:localhost//服务器主机名
Referer:http://localhost/link.asp
User-Agent:Mozilla/4.0
Accept-Encoding:gzip,deflate//客户机能够解码的压缩格式
3、一个空行[作用:标识前面的消息头结束]
get请求缺点:因为要传送的内容已经作为参数附加在了URL地址后面,所以保密性能差,内容不能太长,传送的数据量有限制,一般在18K以下
post请求保密性较好,对内容的长度没有限制 传送的数据量要比GET方式传送的数据量大得多 。
应答消息的结构:
一个状态行、若干消息头、以及实体内容 ,其中的一些消息头和实体内容都是可选的,消息头和实体内容之间要用空行隔开
1、状态行 HTTP/1.1 200 OK[200是状态码,表示应答状态,OK是对状态码的描述]
2、多个消息头
3、一个空行
4、实体内容
HTTP消息其他细节
响应消息的实体内容就是网页文件的内容,也就是在浏览器中使用查看源文件的方式所看到的内容。
一个使用GET方式的请求消息中不能包含实体内容,只有使用POST、PUT和DELETE方式的请求消息中才可以包含实体内容。
对于HTTP 1.1来说,如果HTTP消息中包括实体内容,且没有采用chunked传输编码方式,那么消息头部分必须包含内容长度的字段,否则,客户和服务程序就无法知道实体内容何时结束。
在HTTP协议中,还可以使用简单的请求消息和响应消息,它们都没有消息头部分。简单的请求消息只能用于GET方式,且请求行中不用指定HTTP版本号。对于简单的请求消息,服务器返回简单的响应消息,简单的响应消息中只返回实体内容。
HTTP消息头
使用消息头,可以实现HTTP客户机与服务器之间的条件请求和应答,消息头相当于服务器和浏览器之间的一些暗号指令。
每个消息头包含一个头字段名称,然后依次是冒号、空格、值、回车和换行符。
消息头字段名是不区分大小写的,但习惯上将每个单词的第一个字母大写。
整个消息头部分中的各行消息头可按任何顺序排列。
消息头又可以分为通用信息头、请求头、响应头、实体头等四类。
许多请求头字段都允许客户端在值部分指定多个可接受的选项,多个项之间以逗号分隔。
有些头字段可以出现多次,例如,响应消息中可以包含有多个“Warning”头字段。
响应状态码
(1)100~199
表示成功接收请求,要求客户端继续提交下一次请求才能完成整个处理过程 。
(2)200~299
表示成功接收请求并已完成整个处理过程 。
(3)300~399
为完成请求,客户需进一步细化请求。例如,请求的资源已经移动一个新地址。
(4)400~499
客户端的请求有错误。
(5)500~599
服务器端出现错误。
典型情况
200(正常)
表示一切正常,返回的是正常请求结果。
206(部分内容)
客户发送了一个带有Range头(要求服务器只返回文档中的部分内容)的GET请求,服务器按要求完成了这个请求。
302/307(临时重定向)
指出被请求的文档已被临时移动到别处,此文档的新的URL在Location响应头中给出。
304(未修改)
表示客户机缓存的版本是最新的,客户机应该继续使用它。
401(未经授权)
表示客户机访问的是一个受口令和密码保护的页面,结合使用一个WWW-Authenticate响应头提示客户机应重新发出一个带有Authorization头的请求消息。
404(找不到)
服务器上不存在客户机所请求的资源。
500(内部服务器错误)
服务器端的CGI、ASP、JSP等程序发生错误。