http协议的历史与基本概念

在这里插入图片描述

历史和发展

HTTP(超文本传输协议)的历史和发展如下:

起源:

HTTP协议最初由Tim Berners-Lee在1989年在CERN(欧洲核子研究组织)发明,目的是为了便于科学家之间通过互联网分享文档。最早的HTTP版本现已不被使用,但它奠定了后来版本的基础。

HTTP/0.9(1991年):

简单的文本协议,只支持一个命令:GET。客户端通过TCP连接请求一个资源,服务器返回纯文本格式的HTML文件,然后关闭连接。

HTTP/1.0(1996年,RFC 1945):

HTTP/1.0定义了基本的HTTP结构,引入了方法、状态码和HTTP头的概念。它支持多种类型的资源(如HTML、图片及其他文件类型)的传输,每次请求/响应后都会关闭TCP连接。这个版本使HTTP成为更通用的协议,但每次请求都建立新的TCP连接使得通信效率较低。

HTTP/1.1(1997年,RFC 2068;1999年更新为RFC 2616):

HTTP/1.1是一个重大进步,它引入了持久连接(默认不关闭TCP连接,以便复用于多个请求/响应),管线化(允许一次发送多个请求而不用等待响应)、分块传输编码、额外的缓存控制机制,以及更多的方法和状态码。HTTP/1.1提高了协议的效率和性能,是目前最广泛使用的HTTP版本。

HTTP/2(2015年,RFC 7540):

HTTP/2基于SPDY协议,主要优化了性能,引入了二进制帧、多路复用、服务器推送、头部压缩等功能,这些功能改善了网络延迟和带宽利用效率。HTTP/2使得多个请求可以在同一个TCP连接上并发进行,而不会彼此阻塞(头阻塞问题)。

HTTP/3(正在开发,草案状态):

HTTP/3是对HTTP进一步的发展,主要变化是替换了TCP传输层协议,使用基于UDP的QUIC协议。QUIC提供了更低的连接和传输延迟,改进了连接迁移和安全特性,并且在有丢包的网络环境下表现更好。HTTP/3是对HTTP协议在性能和可靠性方面的进一步提升。

主要区别和改进点:

  • 性能:HTTP/1.1引入了多次请求共用一个TCP连接,HTTP/2进一步引入多路复用和头部压缩,HTTP/3用QUIC降低了连接时延。
  • 安全性:虽然HTTP本身是无状态且无加密的,但随着互联网的发展,加密变得越来越重要。HTTP/2和HTTP/3通常都是与TLS(传输层安全性协议)结合使用的,提高了通信的安全性。
  • 可靠性:QUIC在HTTP/3中的使用减少了TCP因重传而带来的延迟,改善了在不稳定网络下的表现。
  • 简化复杂性:HTTP/2和HTTP/3的设计简化了客户端和服务器端的网络栈处理,使得并发请求更高效。

HTTP协议的发展响应了Web应用不断增长的性能和功能需求,每个新版本都旨在提供更快、更安全、更可靠的网络通信。

演示nc/telnet来演示发起一个http请求

为了使用nc(netcat)或telnet来发起一个HTTP请求,你需要手动输入HTTP请求的原始文本格式。下面是如何使用这两个工具发起一个HTTP GET请求的示例。

使用nc (netcat)

首先,确保你已经安装了nc。然后在命令行中运行以下命令:

nc example.com 80

这会打开到example.com服务器80端口(HTTP默认端口)的TCP连接。接下来,你可以输入HTTP请求:

GET / HTTP/1.1
Host: example.com

确保在Host头和最后一个换行符之间有一个空行,这是HTTP请求头和请求体之间的分隔符。在这里,请求体是空的,因为这是一个GET请求。

使用telnet

如果你使用的是telnet,过程类似。首先,运行以下命令:

telnet example.com 80

在完成输入后,你应该会看到服务器的响应,包括响应头和可能的HTML内容。

以访问csdn.net为例

nc -v csdn.net 80
Connection to csdn.net port 80 [tcp/http] succeeded!
GET / HTTP/1.1
Host: csdn.net

HTTP/1.1 301 Moved Permanently
Server: openresty
Date: Mon, 18 Mar 2024 08:40:11 GMT
Content-Type: text/html
Content-Length: 166
Connection: keep-alive
Keep-Alive: timeout=20
Location: https://www.csdn.net/

<html>
<head><title>301 Moved Permanently</title></head>
<body>
<center><h1>301 Moved Permanently</h1></center>
<hr><center>openresty</center>
</body>
</html>

注意
在现实中,你很少需要使用nc或telnet来手动发起HTTP请求,因为这些工具不支持现代HTTP协议的很多特性(比如HTTPS)。这些演示主要用于教学或调试目的,帮助你理解HTTP请求和响应的基本结构。

对于加密的HTTPS请求,nc和telnet并不适用,因为它们不处理TLS/SSL加密。如果你需要进行加密通信,考虑使用专门的HTTP客户端工具,如curl、wget或者编程语言提供的HTTP库。

基本概念和架构

HTTP协议的基本概念和架构的详细介绍:

基本概念

客户端和服务器:

  • 客户端:通常是用户的Web浏览器,可以是任何HTTP兼容的应用程序,负责发起请求。
  • 服务器:是托管网页资源的系统,响应客户端的请求并发送所请求的数据。

无状态协议:

HTTP是一个无状态协议,意味着服务器不会保存任何请求客户端的状态信息。每个请求都被当作一个新的请求处理,服务器不会记录之前的请求历史。为了维持状态,通常使用cookies等机制。

请求-响应模型:

在HTTP协议中,通信始于客户端发起一个请求,服务器以一个响应结束。一旦交换完成,TCP连接可以被复用或关闭。

方法:

HTTP定义了一系列的方法(动词),用于表示对资源的操作,最常用的包括:

  • GET:请求获取指定资源。
  • POST:提交数据给服务器(如表单提交)。
  • PUT:上传文件或内容到指定资源。
  • DELETE:删除指定资源。
  • HEAD:请求资源的头部信息。

状态码:

每个HTTP响应都包含一个状态码,这个数字响应码告诉客户端请求是否成功,以及如果不成功,问题出在哪里。例如:

  • 200 OK:请求成功。
  • 404 Not Found:请求的资源未找到。
  • 500 Internal Server Error:服务器遇到了一个错误。

URL(统一资源定位符):

用于定位互联网上的资源,如 http://www.example.com/index.html。

URI(统一资源标识符):

是一个用于标识某一互联网资源名称的字符串。

版本:

HTTP协议随时间发展出不同的版本,如HTTP/1.0、HTTP/1.1、HTTP/2,每个版本在性能和功能上有所改进。

架构

HTTP协议主要由以下几个组成部分构成:

请求:

  1. 请求行:包含HTTP方法、请求的URI和HTTP版本。
  2. 请求头:包含对请求描述的元数据,如Host、User-Agent、Accept等。
  3. 空行:分隔请求头和消息主体。
  4. 消息主体(可选):请求的内容,不是所有方法都有消息主体,比如GET请求通常没有。

我们以访问一个链接来具体看一下http的请求体(这是使用chrome开发者工具截取的请求):

GET /namedlock/article/details/136787634 HTTP/1.1
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7
Accept-Encoding: gzip, deflate, br, zstd
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8
Cache-Control: no-cache
Connection: keep-alive
Cookie: uuid_tt_dd=10_21073607390-1630200731683-100282; UN=qq_41928247; smidV2=20210828105959b3f3f
Host: blog.csdn.net
Pragma: no-cache
Referer: https://blog.csdn.net/namedlock/category_12584955.html?spm=1001.2014.3001.5482
Sec-Fetch-Dest: document
Sec-Fetch-Mode: navigate
Sec-Fetch-Site: same-origin
Sec-Fetch-User: ?1
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36
sec-ch-ua: "Chromium";v="122", "Not(A:Brand";v="24", "Google Chrome";v="122"
sec-ch-ua-mobile: ?0
sec-ch-ua-platform: "macOS"

下面是对每一行的解释:

GET /namedlock/article/details/136787634 HTTP/1.1
  • GET: HTTP请求方法,表示要获取指定资源。
  • /namedlock/article/details/136787634: 请求的URI(统一资源标识符),指定了要访问的资源的位置。
  • HTTP/1.1: 请求使用的HTTP协议版本。
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7
  • Accept: 告诉服务器客户端能够处理的媒体类型。这里包括了HTML、XML、图片等多种格式,以及它们的相对优先级权重(通过q参数指定)。
Accept-Encoding: gzip, deflate, br, zstd
  • Accept-Encoding: 告诉服务器客户端支持的内容编码,这里表明客户端支持gzip、deflate、br(Brotli)和zstd(Zstandard)压缩格式。
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8
  • Accept-Language: 告诉服务器客户端的首选语言,这里优先选择中文,其次是英文。
Cache-Control: no-cache
  • Cache-Control: 指定请求和响应遵循的缓存机制,这里的no-cache指示请求不应该被缓存。
Connection: keep-alive
  • Connection: 控制当前的网络连接。keep-alive表示保持连接打开,以便执行后续的请求。
Cookie: uuid_tt_dd=10_21073607390-1630200731683-100282; UN=qq_41928247; smidV2=20210828105959b3f3f
  • Cookie: 包含了一个或多个由服务器设置的cookie,这些cookie存储了客户端的状态信息。
Host: blog.csdn.net
  • Host: 请求的目标主机和端口号(如果指定)。这里表示客户端想要访问的主机是blog.csdn.net。
Pragma: no-cache
  • Pragma: 类似于Cache-Control,是一个旧的HTTP/1.0头部,用于向后兼容。
Referer: https://blog.csdn.net/namedlock/category_12584955.html?spm=1001.2014.3001.5482
  • Referer: 指示请求是从哪个页面链接过来的,这里是从CSDN的某个分类页面跳转过来的。
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36
  • User-Agent: 包含了发出请求的应用程序信息,这里表明请求来自于Mac OS X系统上的Chrome浏览器。

响应:

  1. 状态行:包含HTTP版本、状态码和状态信息。
  2. 响应头:包含对响应描述的元数据,如Content-Type、Content-Length、Cache-Control等。
  3. 空行:分隔响应头和消息主体。
  4. 消息主体(可选):响应的内容,如请求的HTML、图片或其他类型的数据。
    连接管理:

在HTTP/1.0中,每个请求/响应对通常都需要一个新的连接。
HTTP/1.1引入了持久连接,可以在一个连接上发送多个请求和响应。
HTTP/2和HTTP/3进一步优化了连接管理,支持多路复用和其他高级功能。
HTTP的这些基本概念和架构组成了Web通信的核心。

示例:

HTTP/1.1 200 OK
Date: Mon, 18 Mar 2024 08:48:38 GMT
Content-Type: text/html;charset=utf-8
Transfer-Encoding: chunked
Connection: close
Server: WAF
Vary: Accept-Encoding
Content-Language: zh-CN
Strict-Transport-Security: max-age=0; preload
Content-Encoding: gzip
X-Request-Id: 52a7c0cc35a79d5fd5228f8068a4f0e1
Set-Cookie: waf_captcha_marker=a808f4a666fef791039bc958c47e7284f9c4c0dec90a3a90731d829e404fb431; Max-Age=300; Path=/; HttpOnly
X-Cache: BYPASS

下面是对每一行的解释:

HTTP/1.1 200 OK
  • HTTP/1.1: 响应遵循的HTTP协议版本。
  • 200: HTTP状态码,表示请求成功。
  • OK: 状态码的文本描述,也表示请求成功。
Date: Mon, 18 Mar 2024 08:48:38 GMT
  • Date: 响应生成的日期和时间。
Content-Type: text/html;charset=utf-8
  • Content-Type: 响应正文的MIME类型,这里指定为text/html,字符集为UTF-8。
Transfer-Encoding: chunked
  • Transfer-Encoding: 响应正文的传输编码类型,chunked表示数据以一系列块的形式发送,使得服务器可以在生成整个响应内容之前开始发送响应。
Connection: close
  • Connection: 控制当前的网络连接,close指示连接将在响应完成后立即关闭。
Server: WAF

Server: 告知客户端响应是由哪种服务器软件生成的,这里是WAF(可能是指Web应用防火墙)。

Vary: Accept-Encoding
  • Vary: 告诉缓存机制,响应是基于哪些请求头进行变化的。这里表示响应可能因Accept-Encoding请求头的不同而变化。
Content-Language: zh-CN
  • Content-Language: 页面内容的自然语言,这里为简体中文。
Content-Encoding: gzip
  • Content-Encoding: 告诉客户端响应正文的编码方式,这里指定为gzip压缩。
Set-Cookie: waf_captcha_marker=a808f4a666fef791039bc958c47e7284f9c4c0dec90a3a90731d829e404fb431; Max-Age=300; Path=/; HttpOnly
  • Set-Cookie: 服务器告诉客户端要设置一个cookie,这里设置了名为waf_captcha_marker的cookie,有效期300秒,只在根路径(/)下有效,且只能通过HTTP协议访问,不可通过客户端脚本访问(HttpOnly)。

进一步阅读和参考资源

HTTP协议是Web开发的基础,了解其工作原理对于任何网络应用开发人员都是至关重要的。以下是一些HTTP协议学习和参考资源,可以帮助你深入了解并掌握HTTP协议的各个方面:

官方文档和规范

书籍

  • “HTTP: The Definitive Guide” by David Gourley and Brian Totty:
    一本经典的书籍,全面深入地介绍了HTTP协议。
  • “High Performance Browser Networking” by Ilya Grigorik (O’Reilly):
    介绍了网络协议的性能相关方面,包括HTTP/2和WebSocket。
  • “HTTP/2 in Action” by Barry Pollard:
    深入探讨了HTTP/2协议的特性和实现。
  • “Web Performance in Action” by Jeremy L. Wagner:
    讲解了如何利用HTTP协议提高网站性能。
    教程和在线课程

开发工具

  • Postman:
    一个用于构建API和测试HTTP请求的强大工具。
    https://www.postman.com/
  • Wireshark:
    网络协议分析器,可以捕获和分析HTTP通信数据。
    https://www.wireshark.org/
  • cURL:
    命令行工具,支持多种协议,包括HTTP,常用于发送请求和测试。
    https://curl.se/
  • Google Chrome Developer Tools:
    浏览器内置的开发者工具,可以查看HTTP请求和响应,分析性能等。

社区和论坛

  • Stack Overflow:
    一个活跃的开发者社区,可以找到关于HTTP协议和网络通信的讨论和问题。
    https://stackoverflow.com/
  • IETF HTTP Working Group:
    讨论和制定HTTP协议标准的官方工作组。
    https://httpwg.org/

通过这些资源,你可以系统地学习HTTP协议的基础知识,掌握其进阶内容,以及保持对最新发展的了解。对于实践应用,实际编码和使用开发

  • 20
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

namedlock

您的鼓励是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值