HTTP 协议的整体格式

Fiddler抓包与HTTP协议详解：请求与响应格式

原创已于 2023-09-11 21:43:40 修改 · 203 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#http #网络协议 #网络

于 2023-09-11 00:08:47 首次发布

多线程专栏收录该内容

11 篇文章

订阅专栏

本文详细介绍了抓包工具Fiddler的使用，包括HTTP协议的基本格式，请求和响应的组成部分，GET与POST方法的区别，以及URL和请求报头的关键概念。涵盖了状态码和常见HTTP响应。

GET 与 POST 方法有什么区别？经典面试题 !!!

抓包工具 Fiddler

需要的抓包工具 Fiddler

下载教程：http://t.csdn.cn/Mu66s

Fiddler 本质上是一个代理程序，Fiddler开启后客户端与服务端直接的传输都要经过Fiddler。

客户端向服务端发送传输请求时，会先将请求发送给Fiddler 然后再由Fiddler将请求发送给服务端

同理，服务端向客户端发送请求时也会先经过Fiddler

左边就是电脑接收发送的http请求，一般蓝色的就说明传输的是一个html页面, 绿色的是js, 黑色的是数据,

双击某个请求就会出现右边的详情页上面是客户端发送的请求，下面是服务端回复的请求

选择Raw 进行查看http的本体（最原始的效果）

点击View in Notepad 可以生成记事本方便复制粘贴

有时候服务端为了节省网络带宽，会将响应数据压缩成二进制数据，此时点击中间的黄色条框就能进行解码

HTTP 协议格式

HTTP请求本质上就是给tcp scket里写了一个符合http格式的字符串, 下面就来介绍一下http协议的报文格式, 基本格式如下:

1.http请求格式

http请求的报文格式由请求行, 请求报头(header), 请求正文(body)这三部分组成, 报头与正文之间使用空行做标记进行分隔.

比如用Fidder抓到的访问搜狗页面的请求包, 如下:

1.1 请求行

首行由三部分组成

· HTTP协议有很多种方法，GET 方法就是表示从服务器获取某些数据

最常见的还有 POST 方法表示传输实体

· URL表示唯一资源定位符, 俗称网址, 用来标识互联网上唯一资源的位置.

· 最后的表明当前http的版本号

常见的http方法：

GET 与 POST 方法有什么区别？经典面试题 !!!

两者没有本质的区别，使用GET的场景替换成POST也可以用。使用POST的场景替换成GET也行

但两者在使用习惯上存在区别：

1.GET习惯上用来表示获取一个数据，POST习惯用来表示提交一个数据

2.GET一般没有body，需要携带数据则放到URL中， POST一般有body

3.GET请求通常会设计成幂等的，POST则无要求

什么是幂等性？

如果输入一定，得到的输出也一定，这种情况就认为是幂等的

如牛吃草，挤出来的一直是奶这个过程就是幂等的

4.GET 可缓存（前提是具有幂等性） POST不能缓存

5.GET 请求可以被浏览器收藏 POST则不能

认识URL

URL 唯一资源定位符，描述了网络上的唯一的一个资源

URL的结构大概是以下几个部分：

举一个开熏肉大饼的店的例子就是：

URL最关键的四个部分是域名/IP, 端口号, 带层次的路径, 查询字符串, URL里的的有些内容不可省略(必选项), 有些内容可以省略, 具体如下:

协议方案名: 必选项, 使用http或https等协议方案名获取访问资源时要指定协议类型, 不区分字母大小写, 最后附一个冒号:, 使用//与后面的字段分隔, 也可使用 jdbc:mysql:// 或 javascript: // 这类指定数据程序或脚本程序的方案名.

登录信息: 可选项, 现在基本已经不用了.

服务器地址: 必选项, 可以使用DNS可解析的域名或直接使用IP地址来表示, 使用:与端口号分隔, 没有端口号则:省略.

服务器端口号: 可选项, 描述了要访问主机上的哪一个应用程序, 若该字段为空, 浏览器会提供默认的端口号, http是80, https是443.

带层次的文件路径: 必选项, 描述访问的服务器上指定位置的资源, 不同的路径, 拿到的资源是不同的, 最简单的路径就是一个/, 代表的是http服务器的根目录, 可以理解为http服务器是系统上的一个进程, 就让这个进程管理系统上的一个特定的目录, 这个目录里面的资源都可以让外面进行访问, /管理的根目录可以是系统上的任意一个目, 由http服务器具体配置.

查询字符串: 可选项, 是获取资源的时候带的参数, 是以键值对的方式组织(query string), 以?开头, 键值对之间使用&分割, 键和值之间使用=分割; 表示浏览器或者客户端传给服务器自定义的信息, 对获取的资源提出进一步的要求, 一般是程序员自定义, 所以这部分除非是自己写的, 要不然大概率是看不懂的, 使用#与片段标识符分隔.

片段标识符: 可选项, 使用片段标识符通常可标记出已获取资源中的子资源(文档内的某个位置), 但在RFC中并没有明确规定其使用方法.