前言
Web的应用层的协议是超文本传输协议(HyperText Transfer Protocol, HTTP)。。。
一. HTTP概况
HTTP的名字是超文本传输协议,所以可以分为三层来解释它:
1. 怎么解释HTTP
协议?传输?超文本?
-
协议:HTTP 是一个用在计算机世界里的协议。它使用计算机能够理解的语言确立了一种计算机之间交流通信的规范(两个以上的参与者),以及相关的各种控制和错误处理方式(行为约定和规范)。
-
传输:HTTP 协议是一个双向协议。我们在上网冲浪时,浏览器是请求方 A ,百度网站就是应答方 B。
数据虽然是在 A 和 B 之间传输,但允许中间有中转或接力。
就好像第一排的同学想传递纸条给最后一排的同学,那么传递的过程中就需要经过好多个同学(中间人),这样的传输方式就从「A < — > B」,变成了「A <-> N <-> M <-> B」。
而在 HTTP 里,需要中间人遵从 HTTP 协议,只要不打扰基本的数据传输,就可以添加任意额外的东西。
针对传输,我们可以进一步理解了 HTTP。
HTTP 是一个在计算机世界里专门用来在两点之间传输数据的约定和规范。 -
超文本:它就是超越了普通文本的文本,它是文字、图片、视频等的混合体,最关键有超链接,能从一个超文本跳转到另外一个超文本。
所以,HTTP 是一个在计算机世界里专门在「两点」之间「传输」文字、图片、音频、视频等「超文本」数据的「约定和规范」。
2. HTTP常见状态码
状态码 | 具体含义 |
---|---|
1** | 提示信息,表示目前是协议处理的中间状态,还需要后续的操作 |
2** | 成功,报文已被收到且成功处理 |
3** | 重定向,资源位置发生变动,需要客户端重新发送请求 |
4** | 客户端错误,服务器无法处理 |
5** | 服务器错误,处理请求时内部发生错误 |
-
属于提示信息,是协议处理中的一种中间状态,实际用到的比较少。
-
【200 OK】是最常见的成功状态码,表示一切正常。如果是非 HEAD 请求,服务器返回的响应头都会有 body 数据。
【204 No Content】也是常见的成功状态码,与 200 OK 基本相同,但响应头没有 body 数据。
【206 Partial Content】是应用于 HTTP 分块下载或断点续传,表示响应返回的 body 数据并不是资源的全部,而是其中的一部分,也是服务器处理成功的状态。 -
表示客户端请求的资源发生了变动,需要客户端用新的 URL 重新发送请求获取资源,也就是重定向。
【301 Moved Permanently】表示永久重定向,说明请求的资源已经不存在了,需改用新的 URL 再次访问。【302 Found】表示临时重定向,说明请求的资源还在,但暂时需要用另一个 URL 来访问。301 和 302 都会在响应头里使用字段 Location,指明后续要跳转的 URL,浏览器会自动重定向新的 URL。
【304 Not Modified】不具有跳转的含义,表示资源未修改,重定向已存在的缓冲文件,也称缓存重定向,也就是告诉客户端可以继续使用缓存资源,用于缓存控制。
-
表示客户端发送的报文有误,服务器无法处理,也就是错误码的含义。
【400 Bad Request】表示客户端请求的报文有错误,但只是个笼统的错误。
【403 Forbidden】表示服务器禁止访问资源,并不是客户端的请求出错。
【404 Not Found】表示请求的资源在服务器上不存在或未找到,所以无法提供给客户端。
-
表示客户端请求报文正确,但是服务器处理时内部发生了错误,属于服务器端的错误码。
【500 Internal Server Error】与 400 类型,是个笼统通用的错误码,服务器发生了什么错误,我们并不知道。
【501 Not Implemented】表示客户端请求的功能还不支持,类似“即将开业,敬请期待”的意思。
【502 Bad Gateway】通常是服务器作为网关或代理时返回的错误码,表示服务器自身工作正常,访问后端服务器发生了错误。
【503 Service Unavailable】表示服务器当前很忙,暂时无法响应客户端,类似“网络服务正忙,请稍后重试”的意思。
3. HTTP常见字段
- Host字段
有了Host字段,就可以将请求发往同一台服务器上的不同网站。
图示:
- Content-Length字段
服务器在返回数据时,会有 Content-Length 字段,表明本次回应的数据长度。
图示:
上面则是告诉浏览器,本次服务器回应的数据长度是 1000 个字节,后面的字节就属于下一个回应了。
- Connection字段
最常用于客户端要求服务器使用 TCP 持久连接,以便其他请求复用。
HTTP/1.1 版本的默认连接都是持久连接,但为了兼容老版本的 HTTP,需要指定 Connection 首部字段的值为 Keep-Alive。
connection: keep-alive
- Content-Type字段
用于服务器回应时,告诉客户端,本次数据是什么格式。示例:
Content-Type: text/html; charset=utf-8
相对应的,客户端可以使用 Accept 声明自己可以接受哪些格式的数据。
Accept:*/*
- Content-Encoding字段
说明数据的压缩方法。表示服务器返回的数据使用了什么压缩格式。
比如服务器说明自己发送的是 gzip压缩的数据,相应的,客户端用 Accept-Encoding 字段说明自己可以接受哪些压缩方法。示例:
二. GET和POST
1. 之间的区别
- GET 的语义是从服务器获取指定的资源,这个资源可以是静态的文本、页面、图片视频等。GET 请求的参数位置一般是写在 URL 中,URL 规定只能支持 ASCII,所以 GET 请求的参数只允许 ASCII 字符 ,而且浏览器会对 URL 的长度有限制(HTTP协议本身对 URL长度并没有做任何规定)。
比如,在阅读这篇文章时,浏览器就会发送 GET 请求给服务器,服务器就会返回文章的所有文字及资源。
- POST 的语义是根据请求负荷(报文body)对指定的资源做出处理,具体的处理方式视资源类型而不同。POST 请求携带数据的位置一般是写在报文 body 中, body 中的数据可以是任意格式的数据,只要客户端与服务端协商好即可,而且浏览器不会对 body 大小做限制。
比如,你在这篇文章下面评论时,浏览器就会执行一次 POST 请求,把你的留言文字放进了报文 body 里,然后拼接好 POST 请求头,通过 TCP 协议发送给服务器。
2. GET和POST都是安全和幂等的吗
在 HTTP 协议里,
- 所谓的【安全】是指请求方法不会【破坏】服务器上的资源。
- 所谓的【幂等】,意思是多次执行相同的操作,结果都是【相同】的。
如果从 RFC 规范定义的语义来看:
-
GET 方法就是安全且幂等的,因为它是【只读】操作,无论操作多少次,服务器上的数据都是安全的,且每次的结果都是相同的。所以,可以对 GET 请求的数据做缓存,这个缓存可以做到浏览器本身上(彻底避免浏览器发请求),也可以做到代理上(如nginx),而且在浏览器中 GET 请求可以保存为书签。
-
POST 因为是【新增或提交数据】的操作,会修改服务器上的资源,所以是不安全的,且多次提交数据就会创建多个资源,所以不是幂等的。所以,浏览器一般不会缓存 POST 请求,也不能把 POST 请求保存为书签。
但是实际过程中:
可以用 GET 方法实现新增或删除数据的请求,这样实现的 GET 方法自然就不是安全和幂等。
可以用 POST 方法实现查询数据的请求,这样实现的 POST 方法自然就是安全和幂等。