1. HTTP 定义
HTTP(Hyper Text Transfer Protocol, 超文本传输协议),HTTP 是一个在计算机世界里专门在两点之间传输超文本(文字、图片、音频、视频等)等数据的约定和规范。HTML 就是最常见的超文本了,它本身只是纯文字文件,但内部用很多标签定义了图片、视频等的链接,再经过浏览器的解释,呈现给我们的就是一个文字、有画面的网页了。
2.HTTP 是一个无状态协议
- 无状态的优势:因为服务器不需要额外的资源来记录状态HTTP 的状态信息,可减轻服务器的负担,能够把更多的 CPU 和内存用来对外提供服务。
- 无状态的不足:既然服务器没有记忆能力,它在完成有关联性的操作时会非常麻烦。 例如登录->添加购物车->下单->结算->支付,这系列操作都要知道用户的身份才行。但服务器不知道这些请求是有关联的,每次都要问一遍身份信息。 这样每操作一次,都要验证信息。
- 对于无状态的问题,解法方案有很多种,其中比较简单的方式用 Cookie 技术。
3. 层次结构
_______________
|HTTP
|____|____TLS SSL_
|
|___TCP____
|
|___IP_____
|
|__链路层__
由结构可知:
- http是一个应用层协议
- HTTPS 是在 HTTP 与 TCP 层之间增加了 SSL/TLS 安全传输层,HTTP/3 甚至把 TCP 层换成了基于 UDP 的 QUIC。
- http是基于TCP的连接
4.端口号
- http的端口号为 80
- https的端口号为 443
5. http报文格式
5.1. 请求报文(示例):
GET /somedir/page.html HTTP/1.1 /*请求行, 结构为: 方法字段+url字段+http协议版本*/
Host: www.baidu.com /*定义了目标所在主机*/
Connection: Keep-Alive /*HTTP/1.1 版本的默认连接都是持久连接,但为了兼容老版本的 HTTP,需要指定 */
User-agent: Mozilla/5.0 (Windows NT 6.1; WOW64; rv:13.0) Firefox/13.0.1 /*定义用户代理,及浏览器类型*/
Accept-langugae: zh-CN,zh;q=0.9,en;q=0.8 /*请求对象的语言版本,服务器没有就使用默认版本*/
/*附加回车换行*/
(2)说明:
第一行叫做请求行,结构为: 方法字段+url字段+http协议版本
报文是普通的ASCII文本书写的
每行用回车换行(\r\n)结束
最后一行附加有回车换行
该报文有5行,实际上可以有一行或者多行
5.2. HTTP首部字段
首部字段是由首部字段名和字段值构成,中间用冒号“:”隔开。字段值对应单个首部字段可以有多个值,用逗号“,”隔开。
5.3 根据实际用途,分为四种类型
- 通用首部字段:请求报文和响应报文两方都会使用的首部。
- 请求首部字段:从客户端向服务器发送请求报文时使用的首部。
- 响应首部字段:从服务器向客户端返回响应报文时使用的首部。
- 实体首部字段:针对请求报文和响应报文的实体部分使用的首部。
注意:在HTTP协议通信交互中使用到的首部字段不限于RFC2616中定义的上面的47种,还有一些非正式的首部字段,比如 Cookie、Set-Cookie和Content-Disposition等,统一归纳在RFC4229 HTTP Header Field Registrations中。
5.3 HTTP首部字段根据定义缓存代理和非缓存代理的行为分为两种类型:
- 端到端首部(End-to-end Header)
此类别中的首部会转发给请求/响应对应的最终接受目标,而且必须保存在由缓存生成的响应中,另外规定它必须被转发。
- 逐跳首部(Hop-by-hop Header)
此类别中的首部只对单次转发有效,会因通过缓存或代理而不再转发;http1.1和之后的版本,如要使用该首部,需提供Connection首部字段。
HTTP/1.1中的逐跳首部字段(除了这8个,其他所有字段都属于端到端首部)。
Connection、Keep-Alive、Proxy-Authenticate、Proxy-Authorization、Trailer、TE、Transfer-Encoding、Upgrade。
6. HTTP 常见的状态码:
- GET:GET 方法是安全且幂等的,因为它是只读操作,无论操作多少次,服务器上的数据都是安全的,且每次的结果都是相同的。
- POST : POST方法会修改(增删改)服务器上的资源,所以是不安全的且多次提交数据就会创建多个资源,所以不是幂等的。
- HEAD: HEAD方法类似于GET方法,服务器收到HEAD方法时,会用一个http报文响应,不返回请求对象
- PUT : PUT请求的目的是用来替换整个目标资源,PUT请求具有幂等性(idempotent);
- DELETE: 删除服务器上指定对象.
7. TTP/1.1、HTTP/2、HTTP/3 演变
7.1 HTTP/1.1 相比 HTTP/1.0 性能上的改进:
- 使用 TCP 长连接的方式改善了 HTTP/1.0 短连接造成的性能开销。
- 支持管道(pipeline)网络传输,只要第一个请求发出去了,不必等其回来,就可以发第二个请求 出去,可以减少整体的响应时间。
7.2 HTTP/1.1 性能瓶颈:
- 请求 / 响应头部(Header) 未经压缩就发送,首部信息越多延迟越大,只能压缩 Body 的部分。每次互相发送相同的首部造成的浪费较多;
- 服务器是按请求的顺序响应的,如果服务器响应慢,会招致客户端一直请求不到数据,造成 队头阻塞;
- 没有请求优先级控制; 请求只能从客户端开始,服务器只能被动响应。