在之前文章中我们已经介绍了HTTP的首行信息,HTTP协议格式详解之首行信息解析-CSDN博客这篇文章中我们继续介绍HTTP协议的报头部分。
一、报头(HTTP header)
a)请求头部(Request Headers):
-
Host:指定服务器的主机名和端口号,用于确定请求的目标服务器。
在一般情况下,HTTP请求中的Host头部和URL中的主机部分是相同的,因为Host头部指定了目标服务器的主机名。但是在一些特殊情况下,Host头部和URL中的主机部分可能会不同:
-
代理服务器(Proxy Server):当客户端通过代理服务器发送请求时,Host头部通常指定的是目标服务器的主机名,而URL中的主机部分则是代理服务器的主机名。这是因为代理服务器会将客户端的请求转发给目标服务器,但Host头部应该指示目标服务器的主机名,以确保服务器正确识别请求的目标。
-
虚拟主机(Virtual Hosting):在共享主机环境下,一台服务器可能托管了多个网站,这些网站共享同一个IP地址。在这种情况下,服务器根据请求中的Host头部来确定应该将请求转发给哪个网站。因此,URL中的主机部分可能是共享主机的IP地址,而Host头部指示的是请求的实际域名。
-
-
User-Agent:标识发送请求的客户端应用程序、操作系统和设备等信息。服务器可以根据User-Agent来确定如何响应请求,比如为不同的浏览器提供不同的页面版本。
-
Accept:指定客户端所能接受的内容类型,通常用于告知服务器客户端支持哪些媒体类型(如HTML、XML、JSON等)。
-
Accept-Language:指定客户端所能接受的自然语言类型,用于告知服务器客户端偏好的语言。
-
Accept-Encoding:指定客户端所能接受的内容编码方式,用于告知服务器客户端支持的内容编码方式(如gzip、deflate等)。
-
Authorization:用于进行身份验证,通常包含了客户端的凭据(例如用户名和密码)或者其他认证信息。
-
Cookie:包含了之前由服务器通过Set-Cookie响应头设置的Cookie信息,用于在客户端和服务器之间维护会话状态。
-
Cookie是由服务器发送到客户端,并存储在客户端的浏览器中的小型数据片段。它用于在客户端和服务器之间存储会话信息或跟踪用户状态,以便在用户访问同一网站时保持持久性和状态。Cookie通常包含了一些键值对的数据,以及一些关于Cookie的属性:
-
名称(Name):Cookie的名称,用于唯一标识一个Cookie。
-
值(Value):Cookie的值,存储在客户端的数据。
-
域(Domain):指定了Cookie所属的域名。默认情况下,Cookie的域为创建它的服务器的域名,但也可以通过设置Domain属性来指定其他域名。
-
路径(Path):指定了Cookie的可见路径。只有在指定路径下的页面才能访问到这个Cookie,默认情况下,Cookie的路径为创建它的页面路径。
-
过期时间(Expires/Max-Age):指定了Cookie的过期时间。过期时间可以是一个具体的日期时间,也可以是从当前时间开始的秒数。当过期时间到达后,Cookie将被自动删除。
-
安全标志(Secure):指示浏览器仅在通过加密协议(如HTTPS)发送请求时才发送Cookie到服务器。这样可以确保Cookie在传输过程中不被窃取或篡改。
-
HttpOnly标志(HttpOnly):指示浏览器禁止JavaScript访问Cookie,这样可以防止某些类型的跨站点脚本攻击。
-
-
-
Content-Type:指定请求体的内容类型,用于告知服务器请求体的数据类型(如表单数据、JSON数据等)
-
Content-Type是HTTP头部中的一个重要字段,用于指示HTTP消息(如请求体或响应体)中的实体内容的类型和字符集。它告诉客户端或服务器如何解释传输的数据。Content-Type通常由一个主类型和一个子类型组成,用斜杠分隔,例如"text/html"、"application/json"等。以下是Content-Type头部的一些常见取值及其含义:
-
text/plain:纯文本类型,不包含任何格式控制字符,通常用于传输普通文本数据。
-
text/html:HTML文档类型,用于传输HTML格式的网页内容。
-
application/json:JSON数据类型,用于传输结构化的JSON数据。
-
application/xml:XML数据类型,用于传输结构化的XML数据。
-
multipart/form-data:用于通过HTTP POST方法传输表单数据,支持传输文件和文本数据,常用于文件上传。
-
application/x-www-form-urlencoded:用于通过HTTP POST方法传输表单数据,将表单字段以URL编码的形式包含在请求体中。
-
image/jpeg、image/png、image/gif:图片类型,用于传输图片文件的内容。
-
application/octet-stream:二进制数据流类型,表示不属于其他已知类型的任意二进制数据,例如传输文件时常用的类型。
-
-
-
Content-Length:指定请求体的长度,以字节为单位,用于告知服务器请求体的大小。用于处理粘包问题。
-
Referer:指定发送请求的页面的URL,用于告知服务器请求的来源页面。常常与状态码301、302联系
-
Cache-Control:用于指定请求或响应的缓存行为,控制缓存的行为。
-
Connection:指定是否需要保持持久连接,或者是否需要进行连接升级等。
b)响应头部(Response Headers):
- Server:指定了响应的服务器软件信息。
- Date:指定了响应的日期时间。
- Content-Type:指定了响应体的内容类型。与上同
- Content-Length:指定了响应体的长度。与上同
- Set-Cookie:用于设置新的Cookie或更新已有的Cookie。
- Cache-Control:指定了响应的缓存控制方式。
- Expires:指定了响应的过期时间。
- Last-Modified:指定了响应的最后修改时间。
- Location:指定了重定向的目标位置。
- ETag:指定了响应内容的实体标签,用于验证资源是否被修改。
二、请求正文(body)
请求正文(Request Body):
-
格式:请求正文可以是任何格式的数据,如文本、JSON、XML、图片、视频等。
-
内容:请求正文包含了客户端发送给服务器的数据或内容。这些数据可以是表单数据、文件数据、API请求参数等,用于告知服务器客户端的具体需求。
-
编码:通常请求正文的内容会根据请求头部中的Content-Type字段来进行编码,例如application/json表示请求正文是JSON格式的数据。
请求正文的类型通常与请求的方式(HTTP方法)以及具体的应用场景有关。不同的请求方法可能会使用不同的请求正文类型来传递数据,以满足不同的需求。以下是一些常见的请求方法及其常见的请求正文类型:
-
GET:通常不包含请求正文,因为GET请求主要用于获取资源,请求的参数通常会附加在URL中。
-
POST:POST请求常常包含请求正文,用于提交表单数据、上传文件等。常见的请求正文类型包括application/x-www-form-urlencoded(表单数据)、multipart/form-data(文件上传)等。
响应正文(Response Body):
-
格式:响应正文的格式也可以是任何类型的数据,如文本、JSON、XML、图片、视频等。
-
内容:响应正文包含了服务器发送给客户端的实际数据或内容。这些数据可以是网页内容、API响应数据、文件数据等,用于满足客户端的请求。
-
编码:与请求正文类似,响应正文的内容编码通常由响应头部中的Content-Type字段指定,例如text/html表示响应正文是HTML格式的网页内容。
HTTP响应正文的类型通常与响应的状态码和具体的应用场景有关。不同的响应状态码和应用场景可能会使用不同类型的响应正文来传递数据。以下是一些常见的响应状态码及其常见的响应正文类型:
-
200 OK:请求成功,通常返回所请求资源的内容。响应正文类型可以是任何类型的数据,如文本、JSON、XML、HTML、图片、视频等,取决于所请求资源的类型和内容。
-
301 Moved Permanently / 302 Found:重定向状态码,表示资源已被移动到新的URL。通常不包含响应正文,但可以在响应头部的Location字段中指定新的URL。
-
400 Bad Request:客户端请求错误,服务器无法理解请求。响应正文类型通常是错误信息,说明请求的原因或格式错误。
-
404 Not Found:请求的资源未找到。响应正文类型通常是404页面或错误信息,指示用户请求的资源不存在。
-
500 Internal Server Error:服务器内部错误,无法完成请求。响应正文类型通常是错误信息,说明服务器发生了意外错误。
-
503 Service Unavailable:服务不可用,服务器当前无法处理请求。响应正文类型通常是错误信息,说明服务器正在维护或过载。
在HTTP请求和响应中,请求正文和响应正文是可选的,具体是否存在取决于请求或响应的具体内容。有些请求(如GET请求)可能不包含请求正文,而有些响应(如HTTP头部重定向)可能不包含响应正文。然而,对于包含请求或响应正文的HTTP消息,它们承载着实际的数据或内容,用于完成请求的处理和响应的返回。
常见的数据格式及其特点
-
文本(Text):
- 特点:文本格式是最简单和通用的数据格式之一,适用于传输纯文本数据。
- 适用场景:适用于传输普通文本、配置文件、日志等简单的文本数据。
-
JSON(JavaScript Object Notation):
- 特点:JSON是一种轻量级的数据交换格式,易于阅读和编写,适用于表示结构化数据。
- 适用场景:适用于传输API请求和响应数据、Web应用程序中的数据交换、跨平台通信等。
-
XML(eXtensible Markup Language):
- 特点:XML是一种可扩展的标记语言,支持自定义标签和结构化数据,适用于表示复杂的数据格式。
- 适用场景:适用于传输结构化数据、配置文件、Web服务中的数据交换、跨平台通信等。
-
HTML(Hypertext Markup Language):
- 特点:HTML是用于创建网页的标记语言,具有丰富的标签和样式,适用于构建网页内容。
- 适用场景:适用于传输网页内容、构建用户界面、显示富文本内容等。
-
图片(Image):
- 特点:图片格式可以是JPEG、PNG、GIF等,用于传输图像数据。
- 适用场景:适用于传输图像、照片、图表等视觉内容。