HTTP协议特点:
1.支持客户/服务器模式
客户/服务器模式工作方式:由客户端向服务器发出请求,服务器端相应请求,并进行相应服务
2.简单快速
客户向服务器请求服务时,只需传送请求方法和路径
请求方法常用的有GET、HEAD、POST,每种方法规定了客户与服务器联系的类型不同
由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快
3.灵活
HTTP允许传输任意类型的数据对象
正在传输的类型由Content-Type(Content-Type是HTTP包中用来表示内容类型的标识)加以标记
4.无连接
无连接的含义是限制每次连接只处理一个请求
服务器处理完客户的请求,并收到客户的应答后,即断开连接
采用这种方式可以节省传输时间
5.无状态
HTTP协议是无状态协议
无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续需要处理前面的信息,
则它必须重传,这样可能导致每次连接传送的数据量增大
另一方面,在服务器不需要先前信息时它的应答就较快
URI和URL
我们输入在浏览器里的Web地址究竟是URI还是URL?
URI:一个紧凑的字符串用来表示抽象或物理的资源
一个URI可以进一步被分为定位符、名字或两者都是
URL:是URI的子集,除了确定一个资源还提供一种定位该资源的主要访问机制(如其网络“位置”)
URI可以分为URL,URN或是同时具备locators和names特性的一个东西
URN作呕用就好像一个人的名字,URL就像一个人的地址
换句话说:URN确定了东西的身份,URL提供找到它的方式
URL是URI的一种,但不是所有的URI都是URL
URI和URL最大的差别就是“访问机制”
URN是唯一标识的一部分,是身份信息
HTTP报文结构分析-请求报文
报文头分类:
通用报文头
请求报文头
响应报文头
实体报文头
在HTTP/1.1里一共规范了47种报文头字段
a.ACCEPT
作用:浏览器端可以接受的媒体类型
text/html代表浏览器可以接受服务器回发的类型为text/html也就是我们常说的html文档,如果服务器无法返回text/html类型的数据,服务器应该返回一个406错误(Not Acceptable)
Accept:*/*代表浏览器可以处理素有类型
如果想要显示的媒体类型增加优先级,则使用q=来额外表示权重值;重值q的范围是0~1(可精确到小数点后3位),且1为最大值。不指定权重q值时,默认权重为q=1.0.当服务器提供多种内容时,将会首先返回权重值最高的媒体类型
b.Accept-Encoding
作用:浏览器申明子集接收的编码方法,通常指定压缩方法,是否支持压缩,支持什么压缩方法(gzip、deflate)
c.Accept-Language
作用:浏览器申明自己接收的语言
Accept-Language:zh-cn,zh;q=0.7,en-us,en;q=0.3
客户端在服务器有中文版资源的情况下,会请求其返回中文版对应的响应,没有中文版时,则请求返回英文版响应
d.Connection
Connection:keep-alive 当一个网页打开完成后,客户端和服务器之间用于传输HTTP数据的TCP连接不会关闭,如果客户端再次访问这个服务器上的网页,会继续使用这一条已经建立的连接
Connection:close 代表一个Request完成后,客户端和服务器之间用于传输HTTP数据的TCP连接会关闭,当客户端再次发送Request,需要重新建立TCP连接
e.Host
作用:请求报头域主要用于指定被请求资源的Internet主机和端口号,通常从HTTP URL中提取出来
例如:输入 https://www.xxx.com:8080
浏览器发送的请求消息中,就会包含Host请求报头域,Host:www.xxx.com:8080
f.Referer
当浏览器向web服务器发送请求时,一般会带上Referer,告诉服务器我是从哪个页面链接过来的,服务器就可以获得一些信息用于处理
g.User-Agent
作用:告诉HTTP服务器,客户端使用的操作系统和浏览器的名称和版本
很多情况下我们会通过User-Agent来判断浏览器类型,从而进行不同的兼容设计
h.Content-Type
作用:说明了报文体内对象的媒体类型