web、HTTP协议

原神登陆广岛

已于 2023-08-28 15:09:38 修改

阅读量1k

点赞数

文章标签：前端 http 网络协议

于 2023-08-28 01:51:01 首次发布

本文链接：https://blog.csdn.net/personal_liberty/article/details/132529431

版权

一、Web基础

1.1 HTML概述

HTML（HyperText Markup Language）是一种用于创建网页结构和内容的标记语言。它被用于定义网页的结构，包括文本、图像、链接、多媒体内容以及其他元素的排列方式。HTML通过使用一系列称为标签（tags）的特殊代码来描述页面上的不同元素，从而告诉浏览器如何渲染和显示页面。

以下是HTML的一些基本概述：

1. **标记语言**：HTML是一种标记语言，它使用预定义的标签来标记文本中的不同部分，以便浏览器能够正确地解释和渲染页面。

2. **标签（Tags）**：HTML标签是用尖括号包围的关键词，如`<html>`、`<head>`、`<body>`、`<p>`等。标签告诉浏览器如何显示页面的内容，以及如何组织这些内容。

3. **元素（Elements）**：标签与内容的组合被称为元素。一个元素通常由开始标签、内容和结束标签组成，如`<p>这是一个段落。</p>`。有些标签（称为自封闭标签）不需要结束标签，如`<img>`用于插入图像。

4. **文档结构**：HTML文档通常包括`<!DOCTYPE>`声明、`<html>`元素、`<head>`元素和`<body>`元素。`<!DOCTYPE>`声明定义了文档的类型，`<html>`元素是文档的根元素，`<head>`元素包含有关文档的元信息，而`<body>`元素包含实际显示在浏览器中的内容。

5. **属性（Attributes）**：标签可以包含属性，这些属性提供了有关元素的附加信息。属性以名称-值对的形式出现，放置在标签的开始标签中。例如，在`<img>`标签中，`src`属性指定图像的源文件。

6. **链接（Links）**：HTML通过`<a>`标签创建超链接，使用户能够在不同页面之间跳转。超链接可以指向其他页面、文件、位置或网络资源。

7. **列表、表格、表单**：HTML支持创建有序列表（`<ol>`）、无序列表（`<ul>`）、定义列表（`<dl>`）、表格（`<table>`）以及表单（`<form>`）等元素，以便更好地组织和呈现内容。

8. **多媒体**：HTML支持嵌入图像、音频、视频和其他多媒体内容。例如，`<img>`用于嵌入图像，`<audio>`和`<video>`用于嵌入音频和视频。

9. **语义化**：HTML5引入了更多的语义元素，如`<header>`、`<nav>`、`<section>`、`<article>`等，使开发者能够更好地描述页面的结构和内容，同时有助于搜索引擎优化和可访问性。

10. **版本演进**：HTML不断发展，从初始版本到HTML5，不断增加了新的功能和元素，以适应不断变化的网络需求和技术。

总之，HTML是构建网页内容和结构的基础，它定义了网页上的各种元素和如何呈现它们，为用户提供丰富的在线体验。与HTML配合使用的还有CSS（层叠样式表）用于样式设计和布局，以及JavaScript用于实现交互和动态效果。

1.1.1 HTML的文件结构

HTML文件结构示例：

<!DOCTYPE html>
<html>
<head>
    <meta charset="UTF-8">
    <title>Document</title>
</head>
<body>
    <header>
        <h1>Page Title</h1>
        <nav>
            <ul>
                <li><a href="#">Home</a></li>
                <li><a href="#">About</a></li>
                <li><a href="#">Contact</a></li>
            </ul>
        </nav>
    </header>

    <section>
        <h2>Introduction</h2>
        <p>This is the introduction of the page.</p>
    </section>

    <section>
        <h2>Content</h2>
        <p>This is the main content of the page.</p>
    </section>

    <footer>
        <p>&copy; 2023 Your Website</p>
    </footer>
</body>
</html>

<!DOCTYPE html>：这是文档类型声明，指定文档使用的HTML版本。在此例中，它表示使用HTML5。

<html>：这是根元素，包含了整个HTML文档的内容。

<head>：头部部分包含有关文档的元信息，如字符编码、标题等。

<meta charset="UTF-8">：这个标签指定文档使用UTF-8字符编码，以支持多种语言字符集。
<title>：这个标签设置网页的标题，将显示在浏览器的标签页上。

<body>：正文部分包含了实际显示在浏览器中的页面内容。

<header>：通常包含网页的页眉内容，如标题、导航等。

<h1>：定义一个页面标题级别的标题。
<nav>：定义导航部分，包含页面链接。
<ul>：定义无序列表，其中包含导航链接。
<li>：定义列表项，其中包含导航链接。
<a>：定义超链接。

<section>：通常用于划分页面的不同部分，每个部分都可以包含一个标题和内容。

<h2>：定义一个部分标题级别的标题。
<p>：定义段落。

<footer>：通常包含网页的页脚内容，如版权信息、联系方式等。

这只是一个基本的HTML文件结构示例，实际上，可以根据需要添加更多的元素和内容来构建更复杂的网页。这个结构有助于确保网页在各种浏览器中以一致的方式呈现，并为搜索引擎优化和可访问性提供良好的基础。

1.2 HTML中的部分基本标签

基本标签含义

以下是一些在HTML中常用的基本标签及其用途的简要概述：

1. `<html>`：HTML文档的根元素，包含文档的全部内容。

2. `<head>`：文档头部，包含元信息，不会在页面中显示。

   - `<meta>`：定义文档的元信息，如字符编码、关键词等。
   - `<title>`：定义页面标题，显示在浏览器标签栏或窗口标题栏上。

3. `<body>`：文档主体，包含在浏览器中显示的内容。

   - `<h1>`, `<h2>`, `<h3>`...：定义标题，从大到小表示不同级别的标题。
   - `<p>`：定义段落。
   - `<br>`：插入换行。
   - `<hr>`：插入水平线分隔。
   - `<em>`：强调文本，通常以斜体显示。
   - `<strong>`：强调文本，通常以加粗显示。
   - `<a>`：创建超链接。
   - `<img>`：插入图像。
   - `<ul>`：定义无序列表。
   - `<ol>`：定义有序列表。
   - `<li>`：定义列表项。
   - `<table>`：定义表格。
   - `<tr>`：定义表格行。
   - `<th>`：定义表头单元格。
   - `<td>`：定义表格数据单元格。

4. `<div>`：通用的容器标签，用于分组和样式化内容。

5. `<span>`：行内容器标签，用于样式化文本或包裹少量内容。

6. `<form>`：创建表单，用于用户输入数据。

   - `<input>`：输入字段，如文本框、单选按钮、复选框等。
   - `<textarea>`：多行文本输入框。
   - `<select>`：下拉菜单。
   - `<button>`：按钮。

7. `<label>`：标签用于表单元素的标注，提高可访问性。

8. `<iframe>`：嵌入其他网页或文档。

9. `<audio>`、`<video>`：用于嵌入音频和视频。

10. `<script>`：用于插入JavaScript代码。

11. `<style>`：用于内部定义CSS样式。

12. `<link>`：链接外部资源，如CSS文件。

13. `<meta>`：定义文档元信息，如字符编码和关键词。

14. `<meta>`：用于指定文档的字符编码。

15. `<meta>`：设置网页的关键字。

这些标签只是HTML中的一部分，还有许多其他标签可以用于构建更丰富和复杂的页面。每个标签都有其独特的功能和用途，可以根据需要选择适当的标签来实现所需的效果。

1.3 URI 和 URL

概念

URI（Uniform Resource Identifier）和URL（Uniform Resource Locator）之间存在微妙的区别，尽管它们通常被混用。

1. **URI（Uniform Resource Identifier）**：
   - URI是一个通用的术语，用于标识任何形式的资源，不仅限于互联网资源。它可以用于标识本地文件、数据库条目等。
   - URI可以被分为两种子类：URL和URN。
   - 例如，一个ISBN号（International Standard Book Number）就是一个URN，用于唯一标识一本书，但它不提供定位信息。

2. **URL（Uniform Resource Locator）**：
   - URL是URI的一种特定形式，它不仅标识资源，还提供了资源的定位信息，允许通过某种协议访问资源。
   - URL包含了资源的位置信息，包括协议、主机、路径等。
   - 由于URL提供了资源的定位，因此它常常被用来引用网页、图像、视频等网络资源。

3. **URN（Uniform Resource Name）**：
   - URN是URI的另一种子类，它用于通过名称来标识资源，而不提供资源的位置信息。
   - URN的目标是提供持久、独一无二的资源标识，使资源可以在不同位置和协议上被访问，而不受位置和协议的限制。

总之，URI是一个更广泛的概念，用于标识各种资源。URL是URI的一种特定类型，提供了资源的标识和定位信息。URN是另一种URI子类，用于通过名称来标识资源，但不提供定位信息。在实际使用中，术语URL经常用于表示资源的标识和定位，因此这两个概念通常被混淆。

URI（Uniform Resource Identifier）和URL（Uniform Resource Locator）是与定位和标识资源在互联网上的方法相关的概念。尽管它们通常被用来描述相同的内容，但它们在技术上有些微妙的区别。

**URI（Uniform Resource Identifier）**是一个通用的术语，用于标识某个资源的唯一名称。URI可以包含URL和URN（Uniform Resource Name）。URN是一种通过名称来标识资源的方式，而URL则是一种通过位置来标识资源的方式。

**URL（Uniform Resource Locator）**是URI的一个特定类型，它不仅标识资源的名称，还提供了用于定位资源的信息，通常是一个网络地址。URL包括以下几个主要部分：

1. **方案（Scheme）**：指定用于访问资源的协议或方式，如http、https、ftp等。
2. **主机（Host）**：资源所在的服务器的域名或IP地址。
3. **端口（Port）**：资源服务器监听的端口号，如果省略则使用默认端口。
4. **路径（Path）**：资源在服务器上的路径，指示资源的位置。
5. **查询字符串（Query）**：用于传递参数给资源的字符串，通常以键值对的形式存在。
6. **片段标识（Fragment）**：指向资源中的一个特定片段，常用于指示文档中的特定部分（如页面锚点）。

以下是一个URL的示例：

```
https://www.example.com:8080/products?id=12345&page=1#section-2
```

- 方案：https
- 主机：www.example.com
- 端口：8080
- 路径：/products
- 查询字符串：id=12345&page=1
- 片段标识：section-2

总之，URI是一个通用的概念，用于标识资源。URL是URI的一种特定类型，它提供了定位资源的详细信息，包括协议、域名、路径等。

URI 和 URL 的区别

定义范围：URI是一个广义的概念，用于标识和命名互联网上的资源,可以是URL、URN或其他形式。URL是URI的一种具体实现形式，用于资源的定位和访问。

功能重点：URI强调资源的标识性，用于唯一标识和命名资源。URL则更注重资源的位置性，其中包含了定位和访问资源所需的详细信息。

动态资源和静态资源

动态资源和静态资源是两种在Web开发中常用的术语，用于描述不同类型的网页内容。它们之间的区别在于如何生成和呈现内容以及在客户端和服务器之间的交互方式。

**静态资源（Static Resources）**：
静态资源是在服务器上提前创建好并保存在文件系统中的内容，不会在请求时进行任何改变。这些资源可以是HTML、CSS、JavaScript、图像、音频、视频等文件。当客户端请求这些静态资源时，服务器会直接将文件发送给客户端，不涉及服务器端的处理。

静态资源指的是在服务器上保存的文件，其内容在请求和传输过程中不发生变化。

静态资源可以是图片、CSS样式表、JavaScript文件、HTML文件等。

静态资源的请求一般是通过URL直接访问,当客户端发送请求时，服务器直接将这些文件返回给客户端，不进行任何处理。

优点：
- 加载速度较快：由于内容已经准备好并保存在文件系统中，直接返回给客户端，无需额外的服务器处理。
- 适用于不经常变化的内容，如图像、CSS等。

缺点：
- 无法根据用户的个性化需求动态生成内容。
- 不适合处理需要实时更新的内容。

**动态资源（Dynamic Resources）**：
动态资源是在请求时根据客户端请求的参数或其他信息，通过服务器端的处理动态生成的内容。这些资源可以是动态网页、用户个人信息、实时数据等。

动态资源则是在服务器端通过执行脚本或程序生成的内容,需要占用服务器的资源。

服务器会根据请求中的参数和数据，执行相应的脚本或程序来生成动态内容，然后将生成的内容返回给客户端。

动态资源可以是动态网页、API接口等。

优点：
- 可根据用户请求生成个性化内容，如个人资料、搜索结果等。
- 可与数据库或其他后端逻辑进行交互，实现实时更新的功能。

缺点：
- 由于涉及服务器端的处理，加载速度可能较慢，特别是在高流量时。
- 需要服务器端的处理逻辑，可能增加服务器负担。

通常，静态资源适用于不频繁变化的内容，而动态资源适用于需要个性化或实时更新的内容。在实际的Web开发中，这两种资源往往会结合使用，以实现更好的用户体验和功能。例如，一个动态网页可能包含静态的CSS和JavaScript文件，但根据用户请求动态生成内容。

二.HTTP协议

2.1.HTTP概念

HTTP（Hypertext Transfer Protocol）是一种用于在Web上传输数据的协议。它是客户端和服务器之间通信的一种规范，用于请求和响应Web资源。HTTP协议是互联网上最为广泛使用的协议之一，它定义了客户端（如浏览器）和服务器之间如何交换信息。

以下是HTTP协议的一些关键特点和工作方式：

1. **客户端-服务器模型**：HTTP使用客户端-服务器模型，其中客户端发出请求，服务器提供响应。客户端通常是浏览器，而服务器是存储和提供Web资源的主机。

2. **请求（Request）**：客户端发送HTTP请求以获取特定资源。请求包括请求方法、URL、HTTP版本、请求头部和请求体。常见的请求方法包括GET（获取资源）、POST（提交数据）、PUT（更新资源）、DELETE（删除资源）等。

3. **响应（Response）**：服务器根据客户端的请求发送HTTP响应，其中包含状态码、响应头部和响应体。状态码指示了请求的结果，如200表示成功，404表示资源未找到，500表示服务器错误等。

4. **URL（Uniform Resource Locator）**：URL用于标识资源的位置。HTTP请求中的URL指示了客户端想要访问的资源。

5. **状态保持**：HTTP是一种无状态协议，每个请求和响应之间是独立的，服务器不会保留客户端的状态。为了实现状态保持，使用了Cookie和Session等机制。

6. **Cookie**：Cookie是在客户端存储的小型数据片段，由服务器发送到客户端并在后续请求中返回，用于跟踪用户状态和存储用户数据。

7. **缓存**：HTTP支持缓存机制，使得浏览器可以存储一些资源的副本，以减少网络请求，提高性能。

8. **安全性**：HTTP本身不是加密的，故数据传输可能会被拦截。为了保护数据安全，通常使用HTTPS（HTTP Secure）协议，它在HTTP基础上添加了加密层。

9. **持久连接**：为了减少每次请求的开销，HTTP支持持久连接，允许在同一连接上发送多个请求和响应。

总之，HTTP是Web通信的基础，通过定义请求和响应的格式，使客户端能够从服务器请求资源，并获得适当的响应。它是构建Web应用程序和浏览器之间交互的基石。

HTTP协议采用了请求/响应模型。

客户端向服务器发送一个请求，请求头包含请求的方法、URL、协议版本、以及包含请求修饰符、客户信息和内容的类似于MIME的消息结构。

服务器以一个状态行作为响应，响应的内容包括消息协议的版本，成功或者错误编码加上服务器信息、实体元信息以及可能的实体内容。

2.2.HTTP协议版本

HTTP协议经过多次演进，产生了不同版本。以下是一些主要的HTTP协议版本：

1. **HTTP/0.9**：
   - 1991年首次发布，作为早期的HTTP协议版本。
   - 非常简单，只支持GET请求，并且响应只能是HTML内容。
   - 不支持请求头、响应头等现代HTTP特性。

2. **HTTP/1.0**：
   - 1996年发布，引入了更多的功能。
   - 支持多种HTTP请求方法，如GET、POST、HEAD等。
   - 引入了请求头、响应头等特性，使得通信更加丰富。
   - 每个请求-响应都需要一个单独的TCP连接，效率较低。

3. **HTTP/1.1**：
   - 1999年发布，是一个重要的协议版本。
   - 引入了持久连接（Connection Keep-Alive）以减少连接开销。
   - 引入了管道化（Pipelining）允许多个请求在一个连接上同时发送。
   - 引入了虚拟主机（Virtual Host）支持，使多个域名可以共享同一个IP地址。
   - 引入了块传输编码（Chunked Transfer Encoding）和缓存机制等。

4. **HTTP/2**：
   - 2015年发布，是HTTP/1.1的继任者。
   - 引入了二进制分帧层，将HTTP消息拆分成多个帧并以二进制编码传输，提高了传输效率。
   - 支持多路复用，多个请求可以在一个连接上同时进行，减少了延迟。
   - 引入了首部压缩，减少了传输的开销。
   - 提升了安全性，要求使用TLS加密。

5. **HTTP/3**：
   - 2020年发布，是HTTP/2的继任者。
   - 基于QUIC协议，引入了更多的性能优化。
   - 减少了握手延迟，提升了连接的建立速度。
   - 改进了拥塞控制和流量控制机制。

每个HTTP协议版本都在不同程度上改进了性能、安全性和功能，以适应不断变化的网络需求。在实际开发中，了解不同版本的特性和差异是非常重要的，以便选择适合的版本来优化网站或应用的性能和用户体验。

2.3.HTTP请求方法

HTTP定义了多种请求方法（也称为动作或动词），用于指示客户端希望服务器执行的操作。以下是一些常见的HTTP请求方法及其用途：

1. **GET**：
   - 用于请求指定资源的表示形式。
   - 请求参数会附加在URL的查询字符串中。
   - 不应该用于传输敏感数据，因为参数会暴露在URL中。

2. **POST**：
   - 用于向服务器提交数据，通常用于创建新资源。
   - 请求参数通常包含在请求的正文中，而不是URL中。

3. **PUT**：
   - 用于更新指定资源或在不存在时创建资源。
   - 请求中的数据会替代服务器上的相应资源。

4. **DELETE**：
   - 用于删除指定资源。
   - 可能需要对资源进行身份验证以确保权限。

5. **PATCH**：
   - 用于对资源进行部分更新。
   - 请求中的数据表示资源的部分状态。

6. **HEAD**：
   - 类似于GET请求，但服务器只返回响应头，不返回实际内容。
   - 用于检查资源是否存在以及获取其元数据，但不获取实际数据。

7. **OPTIONS**：
   - 用于请求关于服务器支持的请求方法、跨域设置等信息。
   - 服务器会返回支持的方法列表等信息。

8. **CONNECT**：
   - 用于建立到资源的网络连接，通常用于代理服务器。

9. **TRACE**：
   - 用于执行一个消息回环测试，服务器会返回收到的请求内容。
   - 主要用于调试和诊断。

10. **LINK** 和 **UNLINK**：
   - 用于创建和删除链接，但很少使用。

这些HTTP请求方法使客户端能够以不同的方式与服务器交互，执行不同的操作。在实际的Web应用程序中，通常会根据需要使用适当的请求方法来实现所需的功能。

1、GET请求会向数据库发索取数据的请求，从而来获取信息，该请求不会产生副作用。无论进行多少次操作，结果都是一样的。

2、与GET不同的是，PUT请求是向服务器端发送数据的，从而改变信息，无论进行多少次PUT操作，其结果并没有不同。

3、POST请求同PUT请求类似，都是向服务器端发送数据的，但是该请求会改变数据的种类等资源，几乎目前所有的提交操作都是用POST请求的。

4、DELETE请求顾名思义，就是用来删除某一个资源的。

2.4.HTTP请求访问的完整过程

1.建立连接

2.接收请求

3.处理请求

4.访问资源

5.构建响应报文

6.发送响应报文

7.记录日志

2.5.HTTP状态码

#产生502（无效网关）的原因：

数据包没有送到网卡，网络问题；

数据包送进去了（交换机能抓到包），但是网卡没收到，网卡问题或防火墙问题；

网卡接收到了，处理不了，服务问题。（比如服务器当前连接太多，响应太慢；页面素材太多，带宽不够。）

2.6.HTTP请求报文和响应报文

HTTP请求报文和响应报文是在客户端和服务器之间传输的数据结构，用于请求和响应Web资源。它们包含了不同的部分，以描述请求或响应的详细信息。以下是HTTP请求报文和响应报文的基本结构和组成部分：

**HTTP请求报文**：

一个HTTP请求报文由以下部分组成：

1. **请求行**：包括请求方法、请求的URL和HTTP协议版本。

2. **请求头部**：包含各种请求的元信息，如用户代理信息、接受的数据类型、认证信息等。

3. **空行**：一个空行用于分隔请求头部和请求体。

4. **请求体**：在某些请求中，如POST请求，可以包含传输的数据，如表单数据、JSON数据等。

以下是一个HTTP请求报文的示例：

```
GET /example/page.html HTTP/1.1
Host: www.example.com
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64)
Accept: text/html,application/xhtml+xml
```

**HTTP响应报文**：

一个HTTP响应报文由以下部分组成：

1. **状态行**：包括HTTP协议版本、状态码和状态短语。

2. **响应头部**：包含响应的元信息，如服务器信息、数据类型、响应时间等。

3. **空行**：一个空行用于分隔响应头部和响应体。

4. **响应体**：包含实际的响应数据，如HTML内容、JSON数据等。

以下是一个HTTP响应报文的示例：

```
HTTP/1.1 200 OK
Date: Thu, 27 Aug 2023 12:00:00 GMT
Server: Apache
Content-Type: text/html; charset=UTF-8

<!DOCTYPE html>
<html>
<head>
<title>Example Page</title>
</head>
<body>
<h1>Hello, World!</h1>
</body>
</html>
```

总之，HTTP请求报文和响应报文是用于传输客户端请求和服务器响应的结构化数据。它们的组成部分提供了关于请求和响应的详细信息，使得客户端和服务器可以有效地进行通信。