HTTP协议

最新推荐文章于 2023-09-17 17:13:26 发布

lambo mercy

最新推荐文章于 2023-09-17 17:13:26 发布

阅读量83

点赞数

文章标签：前端服务器运维

本文链接：https://blog.csdn.net/m0_65601072/article/details/129883708

版权

一、HTTP协议是什么？

HTTP是应用层最常用的协议之一，浏览器获取到网页就是基于HTTP的

HTTP就是浏览器和服务器之间的交互桥梁

HTTP往往是基于传输层的TCP协议实现的 (HTTP1.0, HTTP1.1, HTTP2.0 均为TCP, HTTP3 基于 UDP 实现)，虽然目前已经实现了HTTP/3.0，但是我们目前主要使用的还是HTTP/1.1和HTTP/2.0为主，我们这里主要介绍HTTP/1.1

当我们在浏览器输入一个网址URL时，浏览器就会向百度服务器发送一个HTTP请求

响应被浏览器解析之后，就得到我们看到的页面了，响应里就包含了页面 HTML, CSS, JavaScript, 图片, 字体等信息 ~

二、Fiddler抓包

2.1 下载安装

在学习http协议详细交互过程，可以借助第三方工具，也称为抓包工具

下载地址：

Download Fiddler Web Debugging Tool for Free by Telerik

2.2 fiddler使用

注意事项：
1.fiddler本质是一个代理程序，可能会和别的代理程序冲突，使用的时候需要关闭其他的代理程序(包括一些浏览器插件)
2.要想正确抓包，还需要开启https功能，当下互联网大部分服务器都是https的，https是基于http搞出来的进化版协议，fiddler默认是不能抓https的包，所以我们需要手动开启并且安装证书

现在试着访问百度主页来进行抓包，每次在抓包之前，先将fiddler上的包全部清空

在访问百度主页的时候，产生的http请求，浏览器在打开一个页面时，产生的http请求可能是多个，也可能是一个，这里关注的是请求百度页面的请求，双击第一条蓝色请求查看请求的详细信息

三、HTTP 请求 (Request)

3.1 初识URL

URL：唯一资源定位符，就是平时简称的网址，互联网上的每一个文件都有一个唯一的URL，指出了文件的位置以及浏览器如何处理它

URL最关键的四部分：
1.域名/IP
2.端口号
3.带层次的路径
4.查询字符串

一个URL部分是可以省略的，省略了端口号，浏览器会为URL提供默认端口号，http默认端口号是80，https的默认端口号是443，我们看到末尾的/也是路径，代表根目录，我们http服务器就可以指定这个路径管理指定的目录。
一个HTTP服务器提供的资源是非常多了，不同的路径会获取到不同的资源。

这个URL就带有query string，是以键值对方式组织的，键值对之间使用&分割，键和值之间使用分割

3.2方法(method)

实际开发中，这里的方法大部分都是用不到的，最常见的就是两个，GET和POST

3.2.1 GET

GET是最常用的HTTP方法，常用于获取服务器上的某个资源，有以下方式构建GET请求：
1.在浏览器地址栏中直接输入URL
2.HTML里的link，img，script，a标签
3.通过 js 来构造get

GET请求首行第一部分为GET，URL中的query string可以为空，也可以不为空，header部分的属性使用键值对组织，没有body部分

3.2.2 POST

POST方法也是我们比较常见的一种方法，经常用于登录界面和文件上传等…
可以通过以下方式来构建POST请求：
1.HTML中的form标签
2.js中使用ajax构造

抓包可以发现我们的post请求是有body的，post的body是由我们程序员自定义的

GET与POST之间的区别
1.GET也可以为服务器传递信息，GET传递的信息一般都是放在query string中，而POST传递的信息则是通过Body
2.语义上的差别。GET请求一般是用于从服务器获取数据，POST一般用于给服务器提交数据
3.GET通常设计为幂等的(相同的输入，得到的结果也相同)，POST不要求幂等
4.GET可以被缓存的，POST一般不能被缓存.(缓存指的是把请求的结果保存下来，下次请求就不必真正请求，直接取缓存结果)

header的整体的格式是键值对结构，每个键值占一行，键和值之间使用分号分隔

Host：大概的描述了服务器所在的地址和端口，Host这里的地址和端口来描述最终要访问的目标，这个内容大概率和URL一样，也有一定的概率是不同的

Content - Length：表示body中的数据长度

Content - Type：表示请求中body中的数据格式

Content - Length，Content - Type，如果是GET请求没有body也没有这两字段，如果是POST请求有body必须要有这两字段

User Agent：描述了浏览器和操作系统的版本（现在主要区分PC和移动）

Refer：表明当前页面的来源，是从哪里来的，如果是地址栏输入URL或者直接点击收藏夹是没有referer的

HTTP是明文传输的，很容易获取到请求内容，也有办法篡改内容，在传输过程中有可能referer被修改，后来为了防止这种现象发生，大家都纷纷升级为https

3.4 Cookie

Cookie是非常重要的一个header属性，本质上是浏览器给网页提供的一个本地存储数据的机制(持久化存储)，网页默认是不允许访问我们计算机的硬盘的(保证安全)，Cookie浏览器对于访问硬盘做出了明确的限制，Cookie是通过键值对的方式来组织数据的

来抓包来观察一下，我们先清除之前的cookie，首先点击URL左侧的图标，选择Cookie

我们发现我们再次请求中包含一个Cookie字段

Cookie从哪里来？
        Cookie中的数据是来自于服务器的，服务器会通过HTTP响应报头(Set - Cookie字段)，服务器决定浏览器的Cookie要存什么

Cookie是在那里存的?
        我们可以认为是存在于浏览器中，存在于硬盘的，Cookie在存的时候是按照浏览器 + 域名来进行细分的，不同的浏览器各自存各自的Cookie，同一个浏览器不同的域名对应不同的Cookie，Cookie里的内容不光是键值对还有过期时间

Cookie要到哪里去?
        回到服务器，客户端可以通过Cookie来保存当前用户使用的中间状态，当客户端访问浏览器时，就会自动将Cookie内容带入请求中，服务器就知道客户端是什么样子，当浏览器保存好Cookie之后，后续再给服务器发送请求的时候，就会自动带上这样的Cookie

3.5 HTTP报文格式

HTTP是一共分为四部分：
1.首行
2.header
3.空行(表示header的结束标志)
4.body

这里大家脑海中大概要有一个Request，Response交互的http请求的过程。

3.6状态码(Status code)

状态码：描述了我们访问一个资源的结果(成功，失败，还是其他的一些情况)

200 OK：表示我们成功访问一个资源
302 Move Temporarily：临时重定向，类似于呼叫转移，当我们访问一个资源时，但是该资源的网址改变了，于是响应报文的header部分会包含一个Location字段，表示要跳转到那个页面
301 Moved Permanently：永久重定向，当浏览器收到这种响应时，后续请求都会改为新的资源路径，301也是通过Location字段来表示要重定向的地址
4XX一般都是我们浏览器的错误
404 Not Found：表示访问的资源不存在，一般都是我们输入的URL有误
403 Forbidden：没有访问限权
5XX一般都是服务器发生的错误
500 Internal Server Error：服务器内部错误，服务器端的源代码出现错误
501 Not Implemented：服务器不支持当前请求所需要的某个功能
504 Gateway Timeout：响应时间太久，浏览器等不及了

lambo mercy

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
HTTP协议

一、HTTP协议是什么？HTTP是应用层最常用的协议之一，浏览器获取到网页就是基于HTTP的HTTP往往是基于传输层的TCP协议实现的 (HTTP1.0, HTTP1.1, HTTP2.0 均为TCP, HTTP3 基于 UDP 实现)，虽然目前已经实现了HTTP/3.0，但是我们目前主要使用的还是HTTP/1.1和HTTP/2.0为主，我们这里主要介绍HTTP/1.1当我们在浏览器输入一个网址URL时，浏览器就会像百度服务器发送一个HTTP请求。
复制链接

扫一扫