HTTP的特点
支持客户/服务器模式
客户/服务器模式工作的方式是由客户端向服务器发出请求,服务器响应请求,并进行相应服务
简单快速:
客户向服务器请求服务时,只需要传送请求方法和路径。
请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同
由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通讯速度很快。
灵活
HTTP允许传输任意类型的对象
正在传输的类型有Content-Type(Content-Type是HTTP包中用来表示内容类型的标识)加以标记
无连接
无连接的含义是限制每次连接只处理一个请求
服务器处理完客户的请求,并收到客户的应答后,即断开连接
采用这种方式可以节省传输时间
无状态
HTTP是无状态协议
无状态是指协议对于事物处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。
另一方面,在服务器不需要先前信息时它的应答就较快。
URI与URL
URI:一个紧凑的字符串用来标示抽象或物理资源
A URI可以进一步被分为定位符、名字或两者都是
术语”Uniform Resource Locator”(URL)是URI的子集,除了确定一个资源,还提供一种定位该资源的主要访问机制(如其网络“位置”)
维基百科:
URI可以分为URL,URN或同时具备locators和names特性的一个东西
URN作用就好像一个人的名字,URL就像一个人的地址
换句话说:URN确定了东西的身份,URL提供了找到它的方式
URL是URI的一种,但不是所有URI都是URL
URI和URL最大的差别是“访问机制”
URN是唯一标识的一部分,是身份信息
HTTP报文
HTTP报文结构分析-请求报文
报文第一行:报文协议及版本 状态码及状态描述
HTTP报文头大体可以分为四类,分别是:
通用报文头、请求报文头、响应报文头和实体报文头
在HTTP/1.1里一共规范了47种报文头字段
四类报文头
常用报文头
ACCEPT
作用:浏览器可以接受的媒体类型
Accept:text/html 代表浏览器可以接受服务器回发的类型为text/html也就是我们常说的html文档,如果服务器无法返回text/html类型的数据,服务器应该返回一个406错误(Non Acceptable)
Accept: */*代表浏览器可以处理所有类型
如果想要给显示的媒体类型增加优先级,则使用q=来额外表示权重值;权重时q的范围时0-1(可精确到小数点后3位),且1为最大值。不指定权重q值时,默认权重为q=1.0。当服务器提供多种内容时,将会首先返回权重值最高的媒体类型。
Accepte-Encoding
作用:浏览器申明自己接收的编码方法,通常指定压缩方法,是否支持压缩,支持什么压缩方法(gzip,deflate)
Accepte-Language
作用:浏览器申明自己接收的语言
Accepte-Language: zh-cn,zh;q=0.7,en-us,en;q=0.3
客户端在服务器有中文版资源的情况下,会请求其返回中文版对应的响应,没有中文版时,则请求返回英文版响应
Connection
Connection: keep-alive 当一个网页打开完成后,客户端和服务器之间用于传输HTTP数据的TCP连接不会关闭,如果客户端再次访问这个服务器上的网页,会继续使用这一条已经建立的连接
Connection: close代表一个Request完成后,客户端和服务器之间用于传输HTTP数据的TCP连接会关闭,当客户端再次发送Request,需要重新建立TCP连接。
Host
作用:请求报头域主要用于指定被请求资源的Internet主机和端口号,它通常从HTTP URL中提取出来的
我们在浏览器中输入: http://www.fljf.com:8080
浏览器发送的请求消息中,就会包含Host请求报头域,如下:Host: www.fljf.com:8080
Referer
当浏览器向web服务器发送请求的时候,一般会带上Referer,告诉服务器我是从哪个页面链接过来的,服务器藉此可以获得一些信息用于处理
User-Agent
作用:告诉HTTP服务器,客户端使用的操作系统和浏览器的名称和版本
很多情况下我们会通过User-Agent来判断浏览器类型,从而进行不同的兼容设计
Content-type
作用:说明了报文体内对象的媒体类型
text/html:HTML格式
text/plain:纯文本格式
text/xml:XML格式
image/gif: gif图片格式
image/jpeg: jpg图片格式
image/png: png图片格式
application/xhtml+xml: XHTML格式
application/xml : XML数据格式
application/atom + xml : Atom XML 聚合格式
application/json: JSON数据格式
application/pdf: pdf格式
application/msword: Word文档格式
application/octet-stream: 二进制流数据(如常见的文件下载)
application/x-www-form-urlencoded: 表单提交
响应报文
响应头 响应体
报文第一行:报文协议及版本 状态码及状态描述
响应体
HTTP请求方法剖析
HTTP/1.1常用方法
GET
POST
PUT
HEAD
DELETE
OPTIONS
TRACE
CONNECT
GET
GET获取资源
GET方法用来请求访问已被URI识别的资源
指定的资源经服务器端解析后返回响应内容
GET方法也可以用来提交表单和其他数据
http://localhost/login.php?username=aa&password=1234
从上面的URL请求中,很容易就可以辨认出表单提交的内容
同时,浏览器对提交URL的长度也有所限制
POST
POST方法与GET功能类似,一般用来传输实体的主体
POST方法的主要目的不是获取响应主体的内容
POST时数据不再是URL的一部分,而是标准数据传输,同时提高了安全性
PUT
从客户端向服务器传送的数据取代指定的文档的内容
PUT方法与POST方法最大的不同是:PUT是幂等的,而POST是不幂等的
因此,我们更多时候将PUT方法用作传输资源
后端代码可以用POST完成更新对象,所以基本不用PUT了
HEAD
类似于GET请求,只不过返回的响应中没有具体的内容,用于获取报头
经常用来测试超链接的有效性
DELETE
请求服务器删除指定的资源
OPTIONS
用来查询针对请求URI指定的资源支持的方法(支持哪些HTTP方法)
TRACE/CONNECT
TRACE:
回显服务器收到的请求,主要用于测试或诊断
CONNECT:
开启一个客户端与所请求资源之间的双向沟通的通道,它可以用来创建隧道
HTTP响应状态码拆解:
状态码
是用以表示网页服务器超文本传输协议响应状态的3位数字代码
1XX 表示消息。这一类型的状态码,代表请求已经被接受,需要继续处理。这类响应式临时响应,只包含状态行和某些可选的响应头信息,并以空行结束。
2XX 表示成功。这一类型的状态码,代表请求已经成功被服务器接收、理解、并接受。
3XX 表示重定向。这类状态码代表需要客户端采取进一步的操作才能完成请求。通常,这些状态码用来重定向,后续的请求地址(重定向目标)在本次响应的Location域中指明。
4XX 表示请求错误。这类状态码代表客户端看起来可能发生了错误,妨碍了服务器的处理。除非是一个HEAD请求,否则服务器就应该返回一个解释当前错误状况的实体,以及这是临时的还是永久性的状况。这些状态码适用于任何请求方法。浏览器应当向用户显示任何包含在此类错误响应中的实体内容。
5XX 表示服务器错误。这些状态码代表了服务器在处理请求的过程中有错误或者异常状态发生,也有可能是服务器意识到以当前的软硬件资源无法完成对请求的处理。除非这是一个HEAD请求,否则服务器应当包含一个解释当前错误状态以及这个状况是临时的还是永久的解释信息实体。浏览器应当向用户展示任何在当前响应中被包含的实体。
常用HTTP状态码
200 OK 请求已成功,请求所希望的响应头或数据体将随此响应返回
202 Accepted 已接受,已经接受请求,但未处理完成
206 Partial Content 部分内容,服务器成功处理了部分GET请求
301 Moved Permanently 永久移动,请求的资源已被永久的移动到新URI,返回信息会包括新的URI,浏览器会自动定向到新URI。今后任何新的请求都应使用新的URI代替。
302 Found 临时移动,与301类似。但资源只是临时被移动。客户端应继续使用原有URI
400 Bad Request 客户端请求的语法错误,服务器无法理解
401 Unauthorized 请求要求用户的身份认证
403 Forbidden 服务器理解请求客户端的请求,但是拒绝执行此请求
404 Not Found 服务器无法根据客户端的请求找到资源(网页)
500 Internal Server Error 服务器内部错误,无法完成请求
502 Bad Gateway 充当网关或代理的服务器,从远端服务器接收到了一个无效的请求。