07-Http的基础知识

最新推荐文章于 2023-11-02 11:28:55 发布

休闲的灵魂

最新推荐文章于 2023-11-02 11:28:55 发布

阅读量458

点赞数 2

分类专栏：计算机网络文章标签：网络 http java 面试数据库

本文链接：https://blog.csdn.net/haazzz/article/details/118074530

版权

计算机网络专栏收录该内容

9 篇文章 1 订阅

订阅专栏

系列文章：

01-计算机网络的体系结构
 02-IP网络层
 03-TCP和UDP的基本认识
 04-TCP三握四挥
 05-TCP的重传机制
 06-TCP的流量控制，拥塞控制
 07-Http的基础知识
 08-HTTPS与加密
 09-其它

参考博客：

小林coding: 硬核！30 张图解 HTTP 常见的面试题

一.Http的基本概念

HTTP 是超文本传输协议。 是一个在计算机世界里专门在「两点」之间「传输」文字、图片、音频、视频等「超文本」数据的「约定和规范」。

二.Http的状态码

在这里插入图片描述

1xx

1xx 类状态码属于提示信息，是协议处理中的一种中间状态，实际用到的比较少。

2xx

2xx 类状态码表示服务器成功处理了客户端的请求，也是我们最愿意看到的状态。

「200 OK」是最常见的成功状态码，表示一切正常。如果是非 HEAD 请求，服务器返回的响应头都会有 body 数据。

「204 No Content」也是常见的成功状态码，与 200 OK 基本相同，但响应头没有 body 数据。

「206 Partial Content」是应用于 HTTP 分块下载或断电续传，表示响应返回的 body 数据并不是资源的全部，而是其中的一部分，也是服务器处理成功的状态。

3xx

3xx 类状态码表示客户端请求的资源发送了变动，需要客户端用新的 URL 重新发送请求获取资源，也就是重定向。

「301 Moved Permanently」表示永久重定向，说明请求的资源已经不存在了，需改用新的 URL 再次访问。

「302 Moved Permanently」表示临时重定向，说明请求的资源还在，但暂时需要用另一个 URL 来访问。

301 和 302 都会在响应头里使用字段 Location，指明后续要跳转的 URL，浏览器会自动重定向新的 URL。

「304 Not Modified」不具有跳转的含义，表示资源未修改，重定向已存在的缓冲文件，也称缓存重定向，用于缓存控制。

4xx

4xx 类状态码表示客户端发送的报文有误，服务器无法处理，也就是错误码的含义。

「400 Bad Request」表示客户端请求的报文有错误，但只是个笼统的错误。

「403 Forbidden」表示服务器禁止访问资源，并不是客户端的请求出错。

「404 Not Found」表示请求的资源在服务器上不存在或未找到，所以无法提供给客户端。

5xx

5xx 类状态码表示客户端请求报文正确，但是服务器处理时内部发生了错误，属于服务器端的错误码。

「500 Internal Server Error」与 400 类型，是个笼统通用的错误码，服务器发生了什么错误，我们并不知道。

「501 Not Implemented」表示客户端请求的功能还不支持，类似“即将开业，敬请期待”的意思。

「502 Bad Gateway」通常是服务器作为网关或代理时返回的错误码，表示服务器自身工作正常，访问后端服务器发生了错误。

「503 Service Unavailable」表示服务器当前很忙，暂时无法响应服务器，类似“网络服务正忙，请稍后重试”的意思。

三. HTTP常用的网络请求方法

在这里插入图片描述

四. GET 和 POST 的区别？

首先我们来说一下他们的定义：

POST代表向指定资源提交数据进行处理；
GET代表请求服务器发送某个资源。

区别：

GET把参数包含在URL中，POST通过request body传递参数。所以POST比GET安全，因为他的数据不会作为URL的一部分，不会缓存在服务器日志中以及浏览记录中，而且POST传递的表单数据URL看不到
POST发送的数据能更大。因为理论上get和post都没有限制，但是由于某些浏览器对url的大小有限制，所以就对get有限制，然后POST的话，这个大小取决于服务器的设置。
GET只能发送ACSII的数据，POST没有限制
GET产生一个TCP数据包；POST产生两个TCP数据包。GET是直接一个TCP数据报将请求头和data一起发了过去，服务器响应200ok；而POST是先将head发送过去，然后服务器响应100 continue之后，再将data发送过去，服务器响应200ok

五.HTTP的特性

HTTP（1.1）的优点有哪些，怎么体现的？

HTTP 最凸出的优点是「简单、灵活和易于扩展、应用广泛和跨平台」。

1. 简单

HTTP 基本的报文格式就是 header + body，头部信息也是 key-value 简单文本的形式，易于理解，降低了学习和使用的门槛。

2. 灵活和易于扩展

HTTP协议里的各类请求方法、URI/URL、状态码、头字段等每个组成要求都没有被固定死，都允许开发人员自定义和扩充。

比如HTTPS 也就是在 HTTP 与 TCP 层之间增加了 SSL/TLS 安全传输层。

3. 应用广泛和跨平台

HTTP 的应用范围非常的广泛，从台式机的浏览器到手机上的各种 APP，从看新闻、刷贴吧到购物、理财、吃鸡，HTTP 的应用片地开花，同时天然具有跨平台的优越性。

Http的缺点

HTTP 协议里有优缺点一体的双刃剑，分别是「无状态、明文传输」，同时还有一大缺点「不安全」。

1. 无状态双刃剑

无状态的好处，因为服务器不会去记忆 HTTP 的状态，所以不需要额外的资源来记录状态信息，这能减轻服务器的负担，能够把更多的 CPU 和内存用来对外提供服务。

无状态的坏处，既然服务器没有记忆能力，它在完成有关联性的操作时会非常麻烦。例如登录->添加购物车->下单->结算->支付，这系列操作都要知道用户的身份才行。但服务器不知道这些请求是有关联的，每次都要问一遍身份信息。这样显示对用户是很不友好的。

2. 明文传输双刃剑

明文意味着在传输过程中的信息，是可方便阅读的，通过浏览器的 F12 控制台或 Wireshark 抓包都可以直接肉眼查看，为我们调试工作带了极大的便利性。

但是这正是这样，HTTP 的所有信息都暴露在了光天化日下，相当于信息裸奔。在传输的漫长的过程中，信息的内容都毫无隐私可言，很容易就能被窃取。

3. 不安全

HTTP 比较严重的缺点就是不安全：

通信使用明文（不加密），内容可能会被窃听。比如，账号信息容易泄漏，那你号没了。
不验证通信方的身份，因此有可能遭遇伪装。比如，访问假的淘宝、拼多多，那你钱没了。
无法证明报文的完整性，所以有可能已遭篡改。比如，网页上植入垃圾广告，视觉污染，眼没了。

六. http-session和cookie

由于Http是无状态的，服务端对于客户端每次发送到额请求都认为她是一个新的请求，上一次会话和下一次会话没有关系。

引入Cookie和Session体系

通过引入cookie和session体系机制来维护状态信息。即用户第一次访问服务器的时候，服务器响应报头通常会出现一个Set-Cookie响应头，这里其实就是在本地设置一个cookie，当用户再次访问服务器的时候，http会附带这个cookie过去，cookie中存有sessionId这样的信息来到服务器这边确认是否属于同一次会话。

Cookie

cookie是由服务器发送给客户端（浏览器）的小量信息，以{key：value}的形式存在。

客户端请求服务器时，如果服务器需要记录该用户状态，就使用response向客户端浏览器颁发一个Cookie。而客户端浏览器会把Cookie保存起来。当浏览器再请求服务器时，浏览器把请求的网址连同该Cookie一同提交给服务器。服务器通过检查该Cookie来获取用户状态。

Session

Cookie机制弥补了HTTP协议无状态的不足。在Session出现之前，基本上所有的网站都采用Cookie来跟踪会话。

与Cookie不同的是，session是以服务端保存状态的。

当客户端请求创建一个session的时候，服务器会先检查这个客户端的请求里是否已包含了一个session标识 - sessionId，

如果已包含这个sessionId，则说明以前已经为此客户端创建过session，服务器就按照sessionId把这个session检索出来使用（如果检索不到，可能会新建一个）
如果客户端请求不包含sessionId，则为此客户端创建一个session并且生成一个与此session相关联的sessionId

sessionId的值一般是一个既不会重复，又不容易被仿造的字符串，这个sessionId将被在本次响应中返回给客户端保存。保存sessionId的方式大多情况下用的是cookie。

区别：

数据存放位置不同：

cookie数据存放在客户端的浏览器上，session数据放在服务器上
安全程度不同：

cookie不是很安全，别人可以分析存放在本地的COOKIE并进行COOKIE欺骗,考虑到安全应当使用session。
性能使用程度不同：

session会在一定时间内保存在服务器上。当访问增多，会比较占用你服务器的性能,考虑到减轻服务器性能方面，应当使用cookie。
数据存储大小不同：

单个cookie保存的数据不能超过4K，很多浏览器都限制一个站点最多保存20个cookie，而session则存储与服务端，浏览器对其没有限制。

七.HTTP-缓存机制

强制缓存

强制缓存时，客户端会先从本地缓存里面找，找到了就判断缓存是否过期。强制缓存主要是两个字段：Expires和Cache-Control

Expires

Expires标识缓存到期时间，是一个绝对时间，也就是说，他返回的是几几年几几月几几日几几时几几分几几秒，如果客户端从他的缓存的这个字段里面找到这个时间，发现这个时间过期了，那就会发起网络请求去获取数据。

但是他的缺点也很明显，由于这个时间是绝对时间，那我客户端修改了本地时间，这个缓存不就失效了嘛。

Cache-Control

为了解决Expires的问题，就引入了Cache-Control。Cache-Control代表了缓存的有效期，是一个相对时间，不管你客户端本地时间是什么，我只会返回给你一个有效期，相当于倒计时，只要这个倒计时到零了，你就给去获取缓存了。我们使用的OKHttp就是使用的cache缓存。

对比缓存

对比缓存就是说他每次都会进行网络请求，只不过服务器会根据他的字段的数据判断他是否需要更新数据，如果需要，就把新数据返给客户端，如果不需要，就返回304状态码让客户端继续使用缓存。

Last-Modified和If-Modified-Since

Last-Modified是服务器返回给客户端的，这个字段规定了资源最后一次修改的时间。然后客户端在网络请求时就会将这个时间保存在If-Modified-Since这个字段里面去，然后服务器判断客户端传来的这个时间是否和他需要请求的资源的最后修改时间是否相等，如果相等，就证明资源没有被修改，返回304，客户端可以继续使用缓存；如果不相等，就证明资源被修改了，那就返回200状态码，并将新的资源发送给客户端。

由于这组关键字他的时间最低单位是秒，所以如果我有一个资源在1S内发生了多次的修改，那Last-Modified和If-Modified-Since这组关键字就没用了。

Etag和If-no-match

和Last-Modified和If-Modified-Since不一样的是，Etag和If-no-match直接使用标识符去代表了。在服务器给客户端发送数据时会带有Etag字段，里面存放着这个文件最后一次被修改后生成的标识符。然后当客户端需要进行网络请求的时候，他就会把Etag里面的关键字放到If-no-match中去，然后去网络请求，服务器会判断这个标识符和服务器现在这个资源的标识符是否相等，如果相等，就证明这个资源还没有被修改，缓存还可以使用，返回304；如果不相等，就证明资源发生了修改，客户端需要更新数据，就返回200以及新的数据。