JavaEE: 深入解析HTTP协议的奥秘(2)

34 篇文章 0 订阅


HTTP

JavaEE: 深入解析HTTP协议的奥秘(1)

书接上文~


认识 URL

平时我们俗称的"网址"其实就是说的 URL .(唯一资源定位符)

URL 不是 HTTP 专属的,很多协议都会用到.

其实除了 URL,还有一个叫 URI(大写的 i )的.(唯一资源标识符).

我们可以简单的理解成, URL 是
URI 的一种实现,实际上,在日常开发中,一般也不会刻意区分 URL 和 URI 这俩概念~
在这里插入图片描述

一个具体的 URL:

https://v.bitedu.vip/personInf/student?userId=10000&classId=100
  • https : 协议方案名.常见的有 http 和 https,也有其他的类型.(例如访问 mysql 时用的 jdbc:mysql)

  • user:pass : 登录信息.现在的网站进行身份认证一般不会再通过 URL 进行了.一般都会省略.

  • v.bitedu.vip : 服务器地址,此处是一个"域名",域名会通过 DNS 系统解析成一个具体的 IP 地址.

  • 端口号 : 上面的 URL 中端口号被忽略了.当端口号省略的时候,浏览器会根据协议类型自动决定使用哪个端口.

    http 协议默认使用 80 端口.
    https 协议默认使用 443 端口.

  • /personInf/student : 带层次的文件路径.

  • userId=10000&classId=100 : 查询字符串(query string).本质是一个键值对结构.键值对之间使用 & 分隔.键和值之间使用 = 分隔.

    query string 中的 key 和 value 的取值和个数,完全都是程序员自己约定的.我们可以通过这样的方式来自定制传输我们需要的信息给服务器.

  • 片段标识 : 次 URL 中省略了片段标识.片段标识主要用于页面跳转.

URL encode 介绍

像 / ? : 等这样的字符,已经被 url 当做特殊意义理解了.因此这些字符不能随意出现.

如果某个参数中需要带有这些特殊字符,就必须先对特殊字符进行转义.

一个中文字符由 UTF-8 或者 GBK 这样的编码方式构成,虽然在 URL 中没有特殊含义,但是仍然需要进行转义.否则浏览器可能吧 UTF-8/GBK 编码中的某个字节当做 URL 中的特殊符号.

转义的规则如下: 把要转的符号/汉字,每个字节以十六进制的方式表示出来,然后从右到左,取4位(不足4位直接处理),每2位做1位,前面加上 %,编码成 %XY 格式.

举个栗子:
在这里插入图片描述
日常开发的时候,大多数情况下不需要我们手动处理转码.
日常使用的一些库(无论是前端的还是后端的)一般都是自带了 url encode / decode 的功能的.

认识 “方法”(method)

HTTP 的方法~
方法就是描述了这个 HTTP 请求的"动作"要干啥.

GET 从服务器拿到一个 XXX 数据.
POST 向服务器发送一个 XXX 数据.
在这里插入图片描述

GET

GET 是最常用的 HTTP 方法.常用于获取服务器上的某个资源.

  1. 直接在浏览器中输入一个 URL,此时就会触发 GET 请求.

  2. HTML 页面中的很多元素会进一步触发 GET 请求.

    举个例子: 在搜狗主页按 Ctrl + F5
    在这里插入图片描述

    直接按 F5 与 按 Ctrl + F5 相比,少了很多东西,这是为啥?
    答: 按 Ctrl + F5 会忽略缓存,强制从服务器重新获取数据.
    浏览器都缓存了啥?
    答: 主要是一些 CSS 文件,JavaScript 文件,图片文件,字体文件等等(这些内容一般是固定的,改变频率非常低,所以只需要在第一次访问搜狗主页的时候,把上述固定的资源都保存到硬盘上,后续再访问搜狗,就没必要重复获取上述的内容了)
    浏览器缓存,节省了服务器的带宽,并且加快了页面的展示速度~

  3. JS代码中也能触发 GET 请求.

POST

POST 请求的场景.

  1. 登录/注册
    在这里插入图片描述
  2. 上传文件
    比如说在 Gitee 上,上传一个头像图片.
    在这里插入图片描述

    这里的 Body 中的内容,就是头像图片的二进制内容(base64 转码后的内容)
    图片本身是二进制的, HTTP 协议虽然也能传输二进制,但是很多时候,也会把二进制数据进行转码(不一定用 urlencode(转码后的体积太大了),还有一种转码方式,base64 编码(另一种把二进制转成文本的方式))

除此之外, POST 也有很多其他的场景.

其实,HTTP 中的 GET 和 POST 很多时候都是可以通用的.


一个经典面试题: GET 和 POST 的区别.

首先,明确抛出结论,这两个方法,其实没有本质区别(GET 能用的场景,换成 POST 也成; POST 能用的场景,换 GET,也不是不行)

但是,没有本质区别,不代表没有区别,在使用习惯上还是有区别的~

  1. 语义不同.
    GET 表示从服务器获取数据.
    POST 表示往服务器提交数据.

  2. 传递数据的方式不同.
    GET 传递数据,通常是通过 query string 把自定义数据交给服务器.
    POST 传递数据,通常是通过 Body 把自定义的数据交给服务器.

  3. GET 方法对应的请求,通常设计成"幂等"的.
    POST 方法对应的请求,对应"幂等性"则无要求.
    以上是HTTP标准文档建议的做法,但是这个区别放在今天不是特别合适了.实际上,幂等不幂等更多的是看业务要求,和方法其实关系不大.

    幂等是啥?
    举个例子:
    在这里插入图片描述

  4. 承接幂等性
    GET 如果设计成幂等的,此时 GET 的结果是可以被缓存的.
    POST 不设计成幂等性,POST就不应该被缓存.

关于 GET 和 POST 的差别,网上还有一些说法:

  1. 有些资料说, POST 比 GET 更安全.
    在这里插入图片描述
    我觉得,上述说法,有些勉强了,安全性核心,在于针对密码进行加密.
    把密码明文传输,即使你是 post ,此时还是不安全,只是不直接显示了,但是黑客稍微抓个包,很容易获取到~

  2. 关于传输的数据量
    网上有个说法, GET 请求能够传输的数据量有上限.(GET 通过 URL 的 query string 传数据)并且 URL 长度存在上限.

    POST 则可以传输更大的数据, Body 这里的长度没有限制~

    HTTP 协议标准上,并没有规定 URL 的长度,之所以有长度上限的说法,是在上古时期的 IE 浏览器,实现的过程中引入的限制.
    咱们现在是 2024 年, IE 浏览器早就完了.

  3. 传输数据类型
    GET 只能传输文本数据.
    POST 可以传输文本,也能传输二进制.

    GET 也能传二进制:

    1. 基于 query string, 可以把二进制进行 urlencode / base64 转码
    2. 给 get 添加 body,并确保使用的库(客户端,服务器)都能支持这种用法即可.

大家也可以把自己的看法说出来,欢迎在评论区讨论~

其他方法

  • PUT 与 POST 相似,只是具有幂等特性,一般用于更新.
  • DELETE 删除服务器指定资源.
  • OPTIONS 返回服务器所支持的请求方法.
  • HEAD 类似于 GET ,只不过响应体不返回,只返回响应头.
  • TRACE 回显服务器端收到的请求,测试的时候会用到这个.
  • CONNECT 预留,暂无使用.

本文到这里就结束啦~

在这里插入图片描述

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

月临水

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值