HTTP 协议解析

目录

HTTP 协议

HTTP(Hyper Text Transfer Protocol 超文本传输协议), 是基于 TCP/IP 通信协议来实现数据传递的应用层协议. 用于 www 万维网服务器(Server-Side)本地浏览器(Client-Side) 之间传输超文本的传输协议.

这里写图片描述

又因为 TCP/IP 协议是一个端到端的面向连接的协议, 所谓的端到端可以理解为进程到进程之间的连接, 所以 HTTP 协议在开始传输数据之前, 首先需要建立一个 TCP 连接, 而 TCP 连接的过程需要 三次握手. 在 TCP 三次握手之后, 成功建立了 TCP 连接, 此后 HTTP 协议就可以进行数据传输了.

这里写图片描述

HTTP 协议工作原理

  • Step 1: Client-Side 与 Server-Side 建立一个 TCP 套接字连接.
  • Step 2:Client-Side 通过 TCP 套接字向 Sever-Side 发送 HTTP Request(请求报文).
  • Step 3: Server-Side 接收并解析 HTTP Request 之后执行事物并返回 HTTP Response.
  • Step 4: 释放 TCP 连接, 若 connection mode 为 close, 则 Server-Side 主动关闭 TCP 连接, Client-Side 被动关闭连接, 最后释放 TCP 连接. 若 connection mode 为 keepalive, 则该连接会保持一段时间, 在该时间内 Server-Side 可以继续接收请求.

HTTP Request

HTTP Request 请求行 + Request_Header + Body 组成:
这里写图片描述

请求行

用于说明请求类型, 要访问的资源以及所使用的HTTP版本.
格式: Method Request-URI HTTP-Version <CR><LF>

  • Method: HTTP Method
  • Request-URI: 统一资源标识符
  • HTTP-Version: 表示请求的HTTP协议版本
  • : 表示回车和换行符(\r\n), 请求行必须由换行符结尾

其中 HTTP Method 有下列几种类型:

  • GET: (获取) 请求获取 Request-URI 标识的资源
  • POST: (创建) 请求在 Request-URI 标识的资源添加新的数据
  • PUT: (更新) 请求向 Request-URI 标识的资源上传其最新内容
  • DELETE: (删除) 请求删除 Request-URI 标识的资源
  • HEAD: 请求获取 Request-URI 标识的资源的 Response-Header
  • TRACE: 请求服务器回送请求信息, 一般用于测试或诊断
  • OPTIONS: 请求获取服务器的性能参数, 或者查询与资源相关的选项
  • CONNECT: 保留将来使用

因为这些 HTTP 协议提供了多种 Method, 所以 HTTP 协议除了作为传输协议之外, 还被作为应用协议.

Request Header

Request Header(请求报头) 是 HTTP Header 的其中一种类型, 用于指定服务器接受的附加信息, 由由若干个请求报头域键值对组成, 报头域的格式为 报头域名: 值 . 下面列出常用的请求报头域:

  • Host: 指定服务器的主机和端口号信息, 发送请求时, 该请求报头域是必需的

  • Authorization: 请求服务器鉴权, 如果服务器的响应代码为 401 未授权, 那么可以发送一个含有 Authorization 请求报头域的请求, 要求服务器对客户端进行鉴权验证.

  • Accept: 指定客户端接受的响应信息数据类型, E.G. 'Accept': 'application/json' 指定接受 JSON 格式数据

  • Accept-Charset: 指定客户端接受的响应信息字符集类型, E.G. Accept-Charset:iso-8859-1,gb2312,utf8

  • Accept-Encoding: 指定客户端接受的内容压缩类型, E.G. Accept-Encoding:gzip.deflate

  • Accept-Language: 指定客户端接受的自然语言类型, E.G. eg:Accept-Language:zh-cn

  • User-Agent: 将客户端操作系统、浏览器和其它本地属性传入服务器

  • Cache-Control:指定请求和响应遵循的缓存机制

  • Connection: 指定 TCP 连接模式

  • Cookie: 最重要的请求头之一, 将 cookie 发送给服务器

EXAMPLE:

GET /562f25980001b1b106000338.jpg HTTP/1.1
Host    img.mukewang.com
User-Agent    Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36
Accept    image/webp,image/*,*/*;q=0.8
Referer    http://www.imooc.com/
Accept-Encoding    gzip, deflate, sdch
Accept-Language    zh-CN,zh;q=0.8

HTTP Response

HTTP Response 由 状态行 + Response_Header + Body 组成:

状态行

格式: HTTP-Version Status-Code Reason-Phrase <CR><LF>

  • HTTP-Version: 服务器 HTTP 协议版本
  • Status-Code: 服务器发回的响应状态码
  • Reason-Phrase: 状态码的文本描述
  • : 状态行也必须以换行符结尾

其中由服务器响应的状态码分为 5 大类型:

  • 1xx: (指示信息) 表示请求已接收,继续处理
  • 2xx: (成功) 表示请求已被成功接收、理解、接受
  • 3xx: (重定向) 要完成请求必须进行更进一步的操作
  • 4xx: (客户端错误) 请求有语法错误或请求无法实现
  • 5xx: (服务器端错误) 服务器未能实现合法的请求

更多状态码

Response Header

用来指定客户端接收的的附加信息.

  • Server: 包含了服务器处理请求的软件环境信息

  • Allow: 服务器支持哪些 HTTP Method

  • Set-Cookie:最重要的响应报头域之一, 用于把 cookie 发送到客户端, 每一个写入 cookie 都会生成一个 Set-Cookie, E.G. Set-Cookie: sc=4c31523a; path=/; domain=.acookie.taobao.com

  • Location: 用于重定向到一个新的位置, 包含新的URL地址

EXAMPLE 1:
这里写图片描述

EXAMPLE 2:

HTTP/1.0 200 OK 
Content-Type: text/plain
Content-Length: 137582
Expires: Thu, 05 Dec 1997 16:00:00 GMT
Last-Modified: Wed, 5 August 1996 15:55:28 GMT
Server: Apache 0.84

<html>
  <body>Hello World</body>
</html>

Body

在客户端发送 Request 或服务器响应 Response 时都可以传输一个 Body(实体), 其由 实体报头域 + 实体正文[可选]组成, 其中实体报头域用于定义了实体正文. 常用的实体报头域有下列几种类型:

  • Content-Type: 指定了发送给接收者的实体正文的媒体格式类型(MIME type), E.G. 'Content-Type': 'application/json'/Content-Type:text/html;charset=GB2312
  • Content-Length: 指定了实体正文的长度, 以十进制数字表示

  • Content-Encoding: 指定了附加在实体正文上的附加内容的压缩类型, E.G. Content-Encoding:gzip

  • Content-Language: 描述了资源所使用的自然语言

  • Expires: 指定了响应过期的日期和时间, 以此更新缓存数据, E.G. Expires:Thu,15 Sep 2006 16:23:12 GMT

  • Last-Modified: 描述了资源的最后修改日期和时间

NOTE: 因为无论 Request 或者 Response 都可能发送 Body, 所以上述的实体报头域是通用的.

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
HTTP(Hypertext Transfer Protocol)是一种用于在网络中传输超文本的协议HTTP协议解析是指对传输的HTTP数据进行分析和处理的过程。 HTTP协议是基于客户端-服务器模型的,客户端发送请求消息给服务器,服务器会返回相应的响应消息。在解析HTTP协议时,主要涉及下面几个方面: 1. 解析请求:客户端发送的请求消息包含请求行、请求头和请求体三个部分。解析请求就是从收到的数据中解析出这些部分的内容,并进行相应的处理。其中,请求行包含了请求的方法(如GET、POST等)、URL和HTTP版本等信息;请求头包含了附加的请求信息,如浏览器类型、文档类型等;而请求体则是可选的,一般用于传递POST请求的参数。 2. 解析响应:服务器返回的响应消息也包含响应行、响应头和响应体三个部分。解析响应就是从收到的数据中解析出这些部分的内容,并进行相应的处理。响应行包含了HTTP状态码(如200表示成功、404表示找不到等)和HTTP版本;响应头包含了附加的响应信息,如服务器类型、返回的数据类型等;响应体则是实际返回的数据。 3. 处理状态码:HTTP协议定义了各种状态码,用于表示请求的处理结果。在解析HTTP协议时,需要根据接收到的状态码进行相应的处理,如根据200判断请求成功,根据404判断页面不存在等。 4. 保持连接:HTTP协议支持保持连接,在解析HTTP协议时,需要根据请求头是否包含Connection字段来判断是否需要保持连接。如果需要保持连接,可以继续使用原来的TCP连接发送下一个请求。 总之,HTTP协议解析是通过解析请求和响应消息,处理状态码和保持连接等方式对HTTP协议的传输数据进行处理和分析的过程。这样就能够正确地读取和理解HTTP传输的数据,实现客户端与服务器的通信。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值