HTTP协议超级详解

目录

计算机网络通信

什么是通信协议

协议的标准化

TCP/IP协议群 :

什么是TCP/IP协议群

什么是应用协议

什么是传输协议

什么是网际协议

服务端口

端口作用

端口分配

常见的应用层协议与端口分配

数据包与处理流程

HTTP协议简介

HTTP协议介绍

HTTP协议发展和版本

HTTP协议特点

HTTP协议中URI、URL、URN

HTTP协议的请求

HTTP协议中的请求信息

请求状态分析(request)

请求行

请求头

请求体

请求方式

HTTP协议的响应

HTTP协议中的响应信息

响应状态分析(response)

响应行头体

响应行

响应头

响应体


在讲HTTP之前,先讲以下计算机网络通信和TCP/IP相关知识!

计算机网络通信

image-20211125145302503

什么是通信协议

简单来说,通信协议就是计算机之间通过网络实现通信时事先达成的一种“约定”;这种“约定”使那些由不同厂商的设备,不同CPU及不同操作系统组成的计算机之间,只要遵循相同的协议就可以实现通信。

协议可以分很多种,每一种协议都明确界定了它的行为规范:2台计算机之间必须能够支持相同的协议,并且遵循相同的协议进行处理,才能实现相互通信。

协议的标准化

计算机通信诞生之初,系统化与标准化未收到重视,不同厂商只出产各自的网络来实现通信,这样就造成了对用户使用计算机网络造成了很大障碍,缺乏灵活性和可扩展性。为解决该问题,国际标准化组织(ISO)在1978年提出了“开放系统互联参考模型”,即著名的OSI/RM模型(Open System Interconnection/Reference Model)。它将计算机网络体系结构的通信协议划分为七层,自下而上依次为:物理层(Physics Layer)、数据链路层(Data Link Layer)、网络层(Network Layer)、传输层(Transport Layer)、会话层(Session Layer)、表示层(Presentation Layer)、应用层(Application Layer)。

image-20211123091201165

除了标准的OSI七层模型以外,常见的网络层次划分还有TCP/IP四层协议以及TCP/IP五层协议,它们之间的对应关系如下图所示:

1

TCP/IP协议群 :

什么是TCP/IP协议群

从字面意义上讲,有人可能会认为 TCP/IP 是指 TCP 和 IP 两种协议。实际生活当中有时也确实就是指这两种协议。然而在很多情况下,它只是利用 IP 进行通信时所必须用到的协议群的统称。具体来说,IP 或 ICMP、TCP 或 UDP、TELNET 或 FTP、以及 HTTP 等都属于 TCP/IP 协议。他们与 TCP 或 IP 的关系紧密,是互联网必不可少的组成部分。TCP/IP 一词泛指这些协议,因此,有时也称 TCP/IP 为网络协议群。

image-20211126112130581

什么是应用协议

应用协议是定义了运行在不同系统上的应用程序进程如何相互传递报文的协议。

常见的应用协议:

  1. FTP协议

    文件传输协议(File Transfer Protocol)。是用于在网络上进行文件传输的一套标准协议,它工作在 OSI 模型的第七层, TCP 模型的第四层, 即应用层,FTP允许用户以文件操作的方式(如文件的增、删、改、查、传送等)与另一主机相互通信。

  2. HTTP协议

    一个简单的请求-响应协议,它通常运行在TCP之上。它指定了客户端可能发送给服务器什么样的消息以及得到什么样的响应。

  3. DNS协议

    DNS(Domain Name System,域名系统),万维网上作为域名和IP地址相互映射的一个分布式数据库,能够使用户更方便的访问互联网,而不用去记住能够被机器直接知读取的IP地址。

  4. SNMP协议

    简单网络管理协议。专门设计用于在 IP 网络管理网络节点(服务器、工作站、路由器、交换机及HUBS等)的一种标准协议,它是一种应用层协议。

什么是传输协议

传输层提供了进程间的逻辑通信,传输层向高层用户屏蔽了下面网络层的核心细节,使应用程序看起来像是在两个传输层实体之间有一条端到端的逻辑通信信道。

  1. TCP协议

    TCP:(Transmission Control Protocol)传输控制协议,TCP是一种面向连接的、可靠的、基于字节流的传输层(Transport layer)通信协议。TCP 为提供可靠性传输,实行“顺序控制”或“重发控制”机制。此外还具备“流控制(流量控制)”、“拥塞控制”、提高网络利用率等众多功能。

  2. UDP协议

    UDP:(User Datagram Protocol)的简称, 是不具有可靠性的数据报文协议。虽然可以确保发送消息的大小,却不能保证消息一定会到达。 

TCP与UDP比较

微信图片_20211124162621

TCP 和 UDP 的优缺点无法简单地、绝对地去做比较:TCP 用于在传输层有必要实现可靠传输的情况;UDP 主要用于那些对高速传输和实时性有较高要求的通信或广播通信。TCP 和 UDP 应该根据应用的目的按需使用。

什么是网际协议

网际协议是一个网络层协议,它包含寻址信息和控制信息 ,可使数据包在网络中路由。

  1. IP协议

    IP协议(Internet Protocol网际互连协议),它主要是完成两个任务,一个是寻找地址,第二个是管理分割数据片。

  2. ICMP协议

    ICMP 的主要功能包括,确认 IP 包是否成功送达目标地址,通知在发送过程当中 IP 包被废弃的具体原因,改善网络设置等。

  3. ARP协议

    ARP协议(Address Resolution Protocol,地址解析协议)是一个位于TCP/IP协议群中的网络层,负责将某个IP地址解析成对应的MAC地址。主机将包含目标IP地址信息的ARP请求广播到网络中的所有主机,并接收返回消息,以此确定目标IP地址的物理地址。 

服务端口

端口作用

端口号用来识别计算机中进行通信的应用程序。因此,它也被称为程序地址。

一台计算机上同时可以运行多个程序。传输层协议正是利用这些端口号识别本机中正在进行通信的应用程序,并准确地进行数据传输。

image-20211123093422469

端口分配

操作系统中一共提供了0~65535可用端口范围。

按端口号分类:

公认端口(Well Known Ports):从0到1023,它们紧密绑定(binding)于一些服务。通常这些端口的通讯明确表明了某种服务的协议。例如:80端口实际上总是HTTP通讯。

注册端口(Registered Ports):从1024到65535。它们松散地绑定于一些服务。也就是说有许多服务绑定于这些端口,这些端口同样用于许多其它目的。例如:许多系统处理动态端口从1024左右开始。

常见的应用层协议与端口分配

image-20211123093555631

 

数据包与处理流程

什么是数据包

通信传输中的数据单位,一般也称“数据包”。在数据包中包括:包、帧、数据包、段、消息。

网络中传输的数据包由两部分组成:一部分是协议所要用到的首部,另一部分是上一层传过来的数据。首部的结构由协议的具体规范详细定义。在数据包的首部,明确标明了协议应该如何读取数据。反过来说,看到首部,也就能够了解该协议必要的信息以及所要处理的数据。包首部就像协议的脸。

image-20211123093719713

数据包处理流程

image-20211123093754803

 

HTTP协议简介

HTTP协议介绍

什么是超文本

超文本是用超链接的方法,将各种不同空间的文字信息组织在一起的网状文本。超文本更是一种用户界面范式,用以显示文本及与文本之间相关的内容。

image-20211123094151415

image-20211126171750022

什么是HTTP协议

HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写, HTTP是万维网(WWW:World Wide Web)的数据通信的基础。

HTTP是一个简单的请求-响应协议,它通常运行在TCP之上。它指定了客户端可能发送给服务器什么样的消息以及得到什么样的响应。

image-20211123094319310

HTTP是一个基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)。

img

 

 

HTTP协议发展和版本

http协议在1991年发布第一个版本版本号为0.9。随后WWW联盟(WWW Consortium-W3C)于1994年成立,http协议被纳入到W3C组织中进行维护和管理。

image-20211123094852748

image-20211123094907809

HTTP1.0

最早在1996年在网页中使用,内容简单,所以浏览器的每次请求都需要与服务器建立一个TCP连接,服务器处理完成后立即断开TCP连接(无连接),服务器不跟踪每个客户端也不记录过去的请求(无状态),请求只能由客户端发起(单向性)。

HTTP1.1

到1999年广泛在各大浏览器网络请求中使用,HTTP/1.0中默认使用Connection: close。在HTTP/1.1中已经默认使用Connection: keep-alive(长连接),避免了连接建立和释放的开销,但服务器必须按照客户端请求的先后顺序依次回送相应的结果,以保证客户端能够区分出每次请求的响应内容。通过Content-Length字段来判断当前请求的数据是否已经全部接收。不允许同时存在两个并行的响应。1.1中最重要的一个特点是支持“长连接”,即“一次连接可以多次请求”。

image-20211123095201768

HTTP2.0

  • 长连接

    在HTTP/2中,客户端向某个域名的服务器请求页面的过程中,只会创建一条TCP连接,即使这页面可能包含上百个资源。 单一的连接应该是HTTP2的主要优势,单一的连接能减少TCP握手带来的时延 。HTTP2中用一条单一的长连接,避免了创建多个TCP连接带来的网络开销,提高了吞吐量。

  • 多路复用 (Multiplexing)

    HTTP2.0中所有加强性能的核心是二进制传输,在HTTP1.x中,我们是通过文本的方式传输数据。在HTTP2.0中引入了新的编码机制,所有传输的数据都会被分割,并采用二进制格式编码。

    image-20211123095310071

    多路复用,连接共享。不同的request可以使用同一个连接传输(最后根据每个request上的id号组合成正常的请求)。

    HTTP2.0中,有两个概念非常重要:帧(frame)和流(stream)。 帧是最小的数据单位,每个帧会标识出该帧属于哪个流,流是多个帧组成的数据流。 所谓多路复用,即在一个TCP连接中存在多个流,即可以同时发送多个请求,对端可以通过帧中的表示知道该帧属于哪个请求。在客户端,这些帧乱序发送,到对端后再根据每个帧首部的流标识符重新组装。通过该技术,可以避免HTTP旧版本的队头阻塞问题,极大提高传输性能。

    image-20211123095327566

    • 首部压缩(Header Compression)

      由于1.1中header带有大量的信息,并且得重复传输,2.0使用encoder来减少需要传输的hearder大小。

    • 服务端推送(Server Push)

      在HTTP2.0中,服务端可以在客户端某个请求后,主动推送其他资源。 可以想象一下,某些资源客户端是一定会请求的,这时就可以采取服务端push的技术,提前给客户端推送必要的资源,就可以相对减少一点延迟时间。在浏览器兼容的情况下也可以使用prefetch。

    • 更安全

      HTTP2.0使用了tls的拓展ALPN做为协议升级,除此之外,HTTP2.0对tls的安全性做了近一步加强,通过黑名单机制禁用了几百种不再安全的加密算法。

    http1.1和http2.0区别

    协议传输格式多路复用首部压缩服务器推送请求优先级
    http1.1文本××××
    http2.0二进制帧
  • http 1.1 开始支持长连接 : 一次连接中客户端能向服务端发送多次请求。

长链接 : 当客户端浏览器第一次发送请求时,会创建一个TCP的一个连接,在这个连接当中,服务端给客户端产生显示之后,这个连接不会被关闭,默认3秒后会关闭,这样我们就不用频繁的去创建tcp连接,从而提高效率,但是会对内存消耗。

HTTP协议特点

支持客户端/服务端模式:

HTTP协议支持客户端服务端模式,需要使用浏览器作为客户端来访问服务端。

简单快速:

客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、POST等。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快

灵活:

HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type(Content-Type是HTTP包中用来表示内容类型的标识)加以标记。

无连接:

每次请求一次,释放一次连接。所以无连接表示每次连接只能处理一个请求。优点就是节省传输时间,实现简单。我们有时称这种无连接为短连接。对应的就有了长链接,长连接专门解决效率问题。当建立好了一个连接之后,可以多次请求。但是缺点就是容易造成占用资源不释放的问题。当HTTP协议头部中字段Connection:keep-alive表示支持长链接

单向性:

服务端永远是被动的等待客户端的请求。

无状态:

HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。为了解决HTTP协议无状态,于是,两种用于保持HTTP连接状态的技术就应运而生了,一个是Cookie,而另一个则是Session。

HTTP协议中URI、URL、URN

URI

URI:(Uniform Resource Identifier),统一资源标识符,是一个用于标识互联网某个唯一资源的字符串名称。

URL和URN都是URI的子集。

url

URI是个纯粹的语法结构,用于指定标识Web资源的字符串的各个不同部分。他不属于定位符,因为根据该标识符无法定位任何资源。

URL

URL(Uniform Resource Location),统一资源定位符,可以帮助我们定位互联网上的某一个唯一资源,相当于是互联网资源的身份证号。

URL的五个元素包括在一个简单的地址中:

  • 传送协议。

  • 服务器。(通常为域名或者IP地址)

  • 端口号。(以数字方式表示,若为HTTP的默认值“:80”可省略)

  • 请求资源路径。

  • 传递数据。(在URL中传递数据是以key=value的结构进行数据绑定,以“?”字符为起点,每个参数以“&”隔开,再以“=”分开参数名称与数据,通常以UTF8的URL编码,避开字符冲突的问题)

举个栗子:

1
http://www.itbaizhan.cn:80/course/id/18.html?a=3&b=4

其中:

  1. http, 是协议;

  2. www.itbaizhan.cn,是服务器域名;

  3. 80,是服务器上的默认网络端口号,默认不显示;

  4. /course/id/18.html,是路径(URI:直接定位到对应的资源);

  5. ?a=3&b=4,请求时传递的数据;

URN

URN(Uniform Resource Name,)统一资源名称,其目的是通过提供一种途径,用于在特定的命名空间资源的标识,以补充网址。

举个栗子:

1
www.itbaizhan.cn:80/course/id/18.html?a=3&b=4 

URN是URI的子集,包括名字(给定的命名空间内),但是不包括访问方式来。

笔记 : 

- URI(统一资源标识符)相当于身份证号,对互联网中的资源进行唯一标识,以字符串的形式
- URL(统一资源定位符):帮我们定位在互联网上的某一些资源,相当于互联网资源的身份证号,在浏览器的地址栏里输入的就是标准的URL地址,能帮我们定位资源。

HTTP协议的请求

image-20211124161353561

HTTP协议中的请求信息

打开一个网页需要浏览器发送很多次Request

  • 当你在浏览器输入URL http://www.itbaizhan.cn 的时候,浏览器发送一个Request去获取 http://www.itbaizhan.cn 的html. 服务器把Response发送回给浏览器。

  • 浏览器分析Response中的 HTML,发现其中引用了很多其他文件,比如图片,CSS文件,JS文件。

  • 浏览器会自动再次发送Request去获取图片,CSS文件,或者JS文件。

  • 等所有的文件都下载成功后。 网页就被显示出来了。

请求状态分析(request)

Request 消息分为3部分,第一部分叫Request line, 第二部分叫Request header, 第三部分是Request body。Request header和Request body之间有个空行。

客户端发送一个HTTP请求到服务器的请求消息包括以下格式:我们以访问:为什么需要学编程,什么样的人可以做程序员?-【官方】百战程序员_IT在线教育培训机构_体系课程在线学习平台为例,查看请求状态:

image-20211123102413022

6

8

实时效果反馈

1.当以GET方式发送请求时,请求共分为

A 两部分。

B 三部分。

C 四部分。

D 五部分。

2.当以POST方式发送请求时,请求共分为

A 两部分。

B 三部分。

C 四部分。

D 五部分。

答案

1=>A 2=>B

笔记 :

  • 在浏览器中按F12,进入开发者工具。

  • Element : 显示请求该页面所响应回来的所有页面当中的元素。

  • console : 控制台

  • Sourse : 显示该站点所依赖的一些其他资源,例 : js/css等

  • get方法只有请求行,请求头,没有请求体

 

请求行

image-20211123104132458

GET /course/id/18.html?a=3&b=4 HTTP/1.1

POST /login HTTP/1.1;

请求头

请求头用于说明是谁或什么在发送请求、请求源于何处,或者客户端的喜好及能力。服务器可以根据请求头部给出的客户端信息,试着为客户端提供更好的响应。请求头中信息的格式为key:value。

  • Host

    客户端指定自己想访问的WEB服务器的域名/IP 地址和端口号。

  • Connection

    连接方式。如果值是close则表示基于短连接方式,如果该值是keep-alive,网络连接就是持久的,在一定时间范围内是不会关闭,使得对同一个服务器的请求可以继续在该连接上完成。

  • Upgrade-Insecure-Requests

    服务端是否支持https加密协议。

  • Cache-Control

    指定请求和响应遵循的缓存机制。

  • User-Agent

    浏览器表明自己的身份(是哪种浏览器)。例如Chrome浏览器:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36。

  • Accept

    告诉WEB服务器自己接受什么介质类型,/ 表示任何类型,type/* 表示该类型下的所有子类型。

  • Accept-Encoding

    浏览器申明自己接收的编码方法,通常指定压缩方法,是否支持压缩,支持什么压缩方法(gzip,deflate)。

  • Accept-Language

    浏览器申明自己接收的语言。语言跟字符集的区别:中文是语言,中文有多种字符集,比如big5,gb2312,gbk等。

  • Accept-Charset

    浏览器告诉服务器自己能接收的字符集。

  • Referer

    表示浏览器应该在多少时间之后刷新文档,以秒计时。

  • Cookie

    可向服务端传递数据一种模型。

请求体

客户端传递给服务器的数据。比如:表单使用post方式提交的数据、上传的文件数据.等。

image-20211123105031799

请求方式

  • GET

    向指定的资源发出“显示”请求。GET请求中会将请求中传递的数据包含在URL中并在浏览器的地址栏中显示。GET请求传递数据时要求数据必须是字符。GET请求可以被浏览器缓存。

  • POST

    向指定资源提交数据,请求服务器进行处理(例如提交表单或者上传文件)。数据被包含在请求体中。POST请求传递数据时,数据可以是字符也可以是字节型数据,默认为字符型。POST请求默认情况下不会被浏览器所缓存。

  • HEAD

    向服务器索要与GET请求相一致的响应,只不过响应体将不会被返回。这一方法可以在不必传输整个响应内容的情况下,就可以获取包含在响应消息头度中的元信息。

  • PUT

    向指定资源位置上传其最新内容。

  • DELETE

    请求服务器删除Request-URI所标识的资源。

GET和POST的区别(重要,面试常问)

  1. GET在浏览器回退时是无害的,而POST会再次提交请求。

  2. GET产生的URL地址可以被Bookmark,而POST不可以。

  3. GET请求会被浏览器主动cache,而POST不会,除非手动设置。

  4. GET请求参数会被完整保留在浏览器历史记录里,而POST中的参数不会被保留。

  5. GET请求在URL中传送的参数是有长度限制的,而POST则没有。对参数的数据类型GET只接受ASCII字符,而POST即可是字符也可是字节。

  6. GET比POST更不安全,因为参数直接暴露在URL上,所以不能用来传递敏感信息。

  7. GET参数通过URL传递,POST放在Request body中。

HTTP协议的响应

 

微信图片_20211124160354

HTTP协议中的响应信息

服务端接收到客户端的请求消息,并将处理信息返回给客户端,以次来表示响应。当服务器收到浏览器的请求后,会发送响应消息给浏览器。一个完整的响应消息主要包括响应行、响应头信息和响应体。

响应状态分析(response)

Response消息也由三部分组成:第一部分叫Response line、第二部分叫Response header、第三部分叫Response body。

服务端为浏览器返回消息格式如下:

9510

响应行

响应行

image-20211124161701735

响应行:

HTTP/1.1 200 OK

响应行中的状态码

和请求消息相比,响应消息多了一个“响应状态码”,它以“清晰明确”的语言告诉客户端本次请求的处理结果。

http状态码分类

image-20211124151949657

常见状态码及含义

200 - 请求成功,已经正常处理完毕

301 - 请求永久重定向,转移到其它URL

302 - 请求临时重定向

304 - 请求被重定向到客户端本地缓存

400 - 客户端请求存在语法错误

401 - 客户端请求没有经过授权

403 - 客户端的请求被服务器拒绝,一般为客户端没有访问权限

404 - 资源未找到,客户端请求的URL在服务端不存在

500 - 服务端出现异常

响应头

响应头用于告知浏览器当前响应中的详细信息,浏览器通过获取响应头中的信息可以知道应该如何处理响应结果。响应头中信息的格式为key:value。

  • Date

    响应的Date使用的是GMT时间格式,表示响应消息送达时间。

  • Server

    服务器通过这个Server告诉浏览器服务器的类型。

  • Vary

    客户端缓存机制或者是缓存服务器在做缓存操作的时候,会使用到Vary头,会读取响应头中的Vary的内容,进行一些缓存的判断。

  • Content-Encoding

    文档的编码(Encode)方式。用gzip压缩文档能够显著地减少HTML文档的响应时间。

  • Content-Length

    表示内容长度。只有当浏览器使用持久HTTP连接时才需要这个数据。

  • Content-Type

    表示响应的文档属于什么MIME类型。

响应体

响应体就是响应的消息体,如果是纯数据就是返回纯数据,如果请求的是HTML页面,那么返回的就是HTML代码,如果是JS就是JS代码,如此之类。

 

MIME类型

什么是MIME类型

MIME(Multipurpose Internet Mail Extensions)多用途互联网邮件扩展类型。是设定某种扩展名的文件用一种应用程序来打开的方式类型,当该扩展名文件被访问的时候,浏览器会自动使用指定应用程序来打开。多用于指定一些客户端自定义的文件名,以及一些媒体文件打开方式。

MIME类型的作用

HTTP协议所产生的响应中正文部分可以是任意格式的数据,那么如何保证接收方能看得懂发送方发送的正文数据呢?HTTP协议采用MIME协议来规范正文的数据格式。

MIME类型的使用

在服务端我们可以设置响应头中Content-Type的值来指定响应类型。

MIME类型对应列表

TypeMeaning
application/mswordMicrosoft Word document
application/octet-streamUnrecognized or binary data
application/pdfAcrobat (.pdf) file
application/postscriptPostScript file
application/vnd.lotus-notesLotus Notes file
application/vnd.ms-excelExcel spreadsheet
application/vnd.ms-powerpointPowerPoint presentation
application/x-gzipGzip archive
application/x-java-archiveJAR file
application/x-java-serialized-objectSerialized Java object
application/x-java-vmJava bytecode (.class) file
application/zipZip archive
audio/basicSound file in .au or .snd format
audio/midiMIDI sound file
audio/x-aiffAIFF sound file
audio/x-wavMicrosoft Windows sound file
image/gifGIF image
image/jpegJPEG image
image/pngPNG image
image/tiffTIFF image
image/x-xbitmapX Windows bitmap image
text/cssHTML cascading style sheet
text/htmlHTML document
text/plainPlain text
text/xmlXML
video/mpegMPEG video clip
video/quicktimeQuickTime video clip
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值