前言:祝大家国庆快乐鸭~ 准备好了嘛,让我们开始!!! Let’s Go !! Go Go Go~
文章目录
本文主要以 HTTP/1.1 (目前最常用的版本)版本为例,对 HTTP 协议结构进行简单介绍
1. 简单的HTTP协议
1.1 HTTP — 客户端与服务器间的通信
HTTP 主要用于实现客户端和服务器间的通信,发出请求的是客户端,提供资源进行响应的是服务器。一般情况下,客户端与服务器的角色是可以交换的,HTTP 可以识别出那端是客户端,那端是服务器。
1.2 通过请求和响应的交换达成通信
1. 请求报文:
请求报文由 请求方法(GET、POST)、请求URI、协议版本、可选择的请求首部字段和内容实体构成
2. 响应报文
响应报文一般由协议版本、状态码、解释状态码的原因短语、可选的响应首部字段及实体主体组成
2.3 HTTP是无状态的协议
HTTP 是一种无状态的协议,即协议对发送过来的请求和响应不作持久化处理
原因: 为了更快地处理大量事务,确保协议的可伸缩性
问题: 但是 HTTP 的这种无状态也会导致一些问题,比如一个网站需要记录用户的登录名及密码
解决: 引入了 Cookie 技术,通过 Cookie 结合 HTTP,就可进入管理状态
2.4 请求 URI 定位资源
HTTP 协议使用 URI 定位互联网上的资源,当客户端请求访问资源而发送请求时,请求报文需要将作为请求资源的 URI 包括在内。
2.5 HTTP方法
HTTP方法用于告知服务器客户端的意图,主要有以下方法:
- GET:获取资源
GET 方法用来请求访问已被 URI 识别的资源。指定的资源经服务器端解析后返回响应内容。也就是说,如果请求的资源是文本,那就保持原样返回;如果是像 CGI(Common Gateway Interface,通用网关接口)那样的程序,则返回经过执行后的输出结果。
- POST: 传输实体主体
POST方法主要用于传输实体的主体,GET 方法也可以,但一般不用 GET
- PUT:传输文件
PUT方法用来传输文件,要求在请求报文主体上包含文件内容,然后保存到请求 URI 指定的位置
出于安全性问题(HTTP 无验证机制),一般不使用该方法,若是配合 Web 应用程序验证机制或遵循 REST标准 可开放该方法
- HEAD:获取首部
获得报文首部,不返回报文主体部分,主要用于确定 URI 的有效性及资源更新的日期时间
- DELETE:删除文件
与 PUT 相反的方法
- OPTIONS: 询问 URI 支持的方法
用于查询针对请求 URI 指定的资源支持 (问服务器当前 URI支持那些方法(GET…))
- TRACE: 追踪路径
TRACE 方法是让 Web 服务器端将之前的请求通信环回给客户端的方法。
客户端通过 TRACK 方法查询发出的请求如何被篡改(代理中转)
- CONNECT: 要求用隧道协议连接代理
CONNET 要求在代理服务器之间建立隧道,用隧道协议进行 TCP 通信。
实现方法:
- SSL —— Secure Sockets Layer 安全套接层协议
- TLS —— Transport Layer Security 传输层安全协议
通过这两个协议加密通信内容,实现隧道传输
2.6 持久连接
在早期的 HTTP 协议中,每进行一次 HTTP 通信,就要断开一次 TCP 连接
早期HTTP协议图解:
问题:
使用浏览器访问含多张图片的 HTML 页面,在请求页面的同时,也会请求其他资源,频繁的建立断开连接会增加通信的开销
2.6.1 持久连接 HTTP keep-alive
只要任意一端没有明确地提出断开连接,保持 TCP 连接状态
2.6.2 管线化
持久化的出现促生了管线化,管线化使得不用等待响应即可发送下一个请求,即实现同时并发多个请求
2.7 使用 Cookie 的状态管理
保留无状态特性的同时,避免让服务器管理所有状态 —— Cookie 技术
通过在请求响应报文中写入 Cookie 信息控制客户端的状态
2.7.1 Cookie机制
第一次通信:
服务器生成 Cookie,将其加入响应中发给客户端,客户端保存这个 Cookie
第一次通信时客户端请求报文(没有 Cookie)
第一次通信服务器的响应报文 (通过 Set-Cookie 让客户端记住 Cookie)
第二次通信
第二次通信时,客户端发送的请求中增加了 Cookie 字段,服务器根据此 Cookie 进行响应
第二次通信中的请求报文(增加了 Cookie字段)