2.1 HTTP 协议用于客户端和服务器端之间的通信
在两台计算机之间使用 HTTP 协议通信时,在一条通信线路上必定有一端是客户端,另一端是服务器端。有时候两台计算机作为客户端和服务器端的角色有可能会互换。但仅从一条通信路线来说,服务器端和客户端的角色是确定的,用 HTTP 协议能够明确区分哪端是客户端,哪端是服务器端。
2.2 通过请求和响应的交换达成通信
HTTP 协议规定,请求从客户端发出,最后服务器端响应该请求并返回。肯定是先从客户端开始建立通信的,服务器端在没有接收到请求之前不会发送响应。
一个示例:
请求内容的意思是:请求访问某台 HTTP 服务器上的 /index.htm 页面资源。
请求报文是由请求方法、请求 URI、协议版本、可选的请求首部字段和内容实体构成的,结构如下:
响应报文基本上由协议版本、状态码(表示请求成功或失败的数字代 码)、用以解释状态码的原因短语、可选的响应首部字段以及实体主 体构成,结构如下:
2.3 HTTP 是不保存状态的协议
HTTP 是一种不保存状态,即无状态协议。HTTP 协议自身不具备保存之前发送过的请求或响应的功能 。
为什么http不保存状态?
答:这是为了更快地处理大量事务,确保协议的可伸缩性,而特意把 HTTP 协议设 计成如此简单的。
注:为了实现期望的保持状态功能,引入Cookie 技术
2.4 请求 URI 定位资源
HTTP 协议使用 URI 定位互联网上的资源。
指定请求 URI 的方式:
如果不是访问特定资源而是对服务器本身发起请求,可以用一个 * 来代替请求 URI,如:OPTIONS * HTTP/1.1
2.5 告知服务器意图的 HTTP 方法
GET :获取资源
POST:传输实体主体
PUT:传输文件(PUT 方法自身不带验证机制,有安全性问题)
HEAD:获得报文首部
DELETE:删除文件
OPTIONS:询问支持的方法
TRACE:追踪路径 (不常用)
CONNECT:要求用隧道协议连接代理 (使用 SSL和 TLS协议把通信内容加密后经网络隧道传输 )
2.6 使用方法下达命令
向请求 URI 指定的资源发送请求报文时,采用称为方法的命令。方法的作用在于可以指定请求的资源按期望产生某种行为
2.7 持久连接节省通信量
HTTP 协议的初始版本中,每进行一次 HTTP 通信就要断开一次 TCP 连接。
当初为什么这样做?
答:以当年的通信情况来说,因为都是些容量很小的文本传输,所以即使 这样也没有多大问题
这样做引起了哪些问题?
答:当使用浏览器浏览一个包含多张图片的 HTML 页面时,在发送请求访问 HTML 页面资源的同时,也会请求该 HTML 页面里包含的其他资源。因此,每次的请求都会造成无谓的 TCP 连接建立和断开,增加通信量的开销。
如何解决?
答:持久连接,即只要任意一端没有明确提出断开连接,则保持 TCP 连接状态。
持久连接的好处:
- 减少了 TCP 连接的重复建立和断开所造成的额外开销,减轻了服务器端的负载
- 持久连接使得多数请求以管线化方式发送成为可能。从前发送请求后需等待并收到响应,才能发送下一个请求,管线化技术 出现后,就能够做到同时并行发送多个请求
2.8 使用 Cookie 的状态管理
HTTP 是无状态协议,无法根据之前的状态进行本次的请求处理。无状态协议的优点和缺点如下:
优点:由于不必保存状态,可减少服务器的 CPU 及内存资源的消耗。
缺点:如果让服务器管理全部客户端状态则会成为负担
Cookie技术出现的原因?
答:为了保留无状态协议这个特征的同时又要解决类似的矛盾问题,引入Cookie 技术
Cookie 的原理?
Cookie 会根据从服务器端发送的响应报文内的一个叫做 Set-Cookie 的首部字段信息,通知客户端保存 Cookie。当下次客户端再往该服务器发送请求时,客户端会自动在请求报文中加入 Cookie 值后发送出去。服务器端发现客户端发送过来的 Cookie 后,会去检查究竟是从哪一个客户端发来的连接请求,然后对比服务器上的记录,最后得到之前的状态信息