HTTP 协议介绍

什么是 HTTP 协议?

HTTP,全称是 HyperText Transfer Protocol,中文叫做超文本传输协议。它是一种用于分布式、协作式和超媒体信息系统的应用层协议

HTTP 协议概述

HTTP 是一个客户端(用户)和服务器端(网站)请求和应答的标准(TCP)。
通过使用网页浏览器、网络爬虫或者其他工具,客户端发起一个 HTTP 请求到服务器上指定的端口(默认端口为 80),我们称这个客户端为用户代理程序(user agent)。应答的服务器上存储这一些资源,比如 HTML文件、图像等,我们称这个应答服务器为源服务器(origin server)。在用户代理程序和源服务器中间可能存在多个“中间层”,比如代理服务器、网关或者隧道(tunnel)。

尽管 TCP/IP 协议是互联网上最流行的应用,但在 HTTP 协议中,并没有规定必须使用它或者他支持的层。事实上,HTTP 可以在任何互联网协议上,或者其他网络上实现。HTTP 假定其下层协议提供可靠的传输。因此,任何能够提供这种保证的协议都可以被其使用。因此,也就是其在 TCP/IP 协议族使用 TCP 作为其传输层。

通常,由 HTTP 客户端发起一个 请求,创建一个到服务器指定端口(默认为 80)的 TCP 连接。HTTP 服务器则在那个端口监听客户端的请求。一旦收到请求,服务器会向客户端返回一个状态,比如 “HTTP/1.1 200 OK”,以及返回的内容,如请求的文件、错误信息、或者其他信息。

HTTP 工作原理

HTTP 协议定义 Web 客户端如何从 Web 服务器请求 Web 页面,以及服务器如何把 Web 页面传送给客户端。HTTP 协议采用了“请求/响应模型”。

客户端想服务器发送一个请求报文,请求报文包含了请求方法、URL协议版本、请求头部和请求数据。服务器以一个状态行作为响应,响应的内容包括协议的版本、成功或错误代码、服务器信息、响应头部和响应数据

HTTP 报文可以分为两类:请求报文(request message)和响应报文(response message),两者的基本报文结构相同。

在这里插入图片描述

请求报文的格式:

<method> <request-URL> <version><headers><entiry-body>

响应报文格式:

<version> <status> <reason-phrase><headers><entity-body>

报文对应表示:

> // method: 客户端希望服务器对资源执行的动作。是一个单独的词,比如 GET、HEAD 或 POST;
> // request-URL:命名了所请求的资源,或者 URL 路径组件的完整 URL
> // version: 报文所使用的 HTTP版本,格式:HTTP/<major>.<minor>,主版本号和次版本号都是整数
> // headers: 首部,可以有零个或多个首部,毎个首部都包含一个名字,后面跟着一个冒号(:),然后是一个可选的空格,接着是一个值,最后是一个CRLF。首部是由一个空行(CRLF)结束的,表示了首部列表的结束和实体主体部分的开始
> // entity-body:主体部分,包含一个由任意数据组成的数据块,并不是所有的报文都包含实体的主体部分,有时报文是已一个 CRLF 结束的。

注意:请求行、响应行的每个字段都是由“空格符”进行分割的。

HTTP 请求/响应的步骤

  • 客户端连接到 Web 服务器
    一个 HTTP 客户端。通常是浏览器,与 Web 服务器的 HTTP 端(默认为 80)建立一个 TCP 套接字连接。如:http://www.baidu.com;
    发送 HTTP 请求
    通过 TCP 套接字,客户端向 Web 服务器发送一个文本的请求报文,一个请求报文包括请求行、请求头部、空行和请求数据 4 部分组成。

  • 服务器接受请求并返回 HTTP 响应
    Web 服务器解析请求,定位请求资源。服务器将资源副本写到 TCP 套接字,由客户端读取。一个响应由状态行、响应头部、空行和响应数据 4 部分组成。

  • 释放 TCP 连接
    如果 connect 模式为 close,则服务器阻断关闭 TCP 连接,客户端被动关闭连接,释放 TCP 连接;如果 connection 模式为 keepalive,则该连接会保持一段时间,在改时间内可以继续接收请求。

  • 客户端浏览器解析 HTML 内容。
    客户端浏览器首先解析状态行,查看表明请求是否成功的状态代码,然后解析每一个响应头,响应头告知以下为若干字节的 HTML 文档和文档的字符集。客户端浏览器读取响应数据 HTML,根据 HTML 语法堆砌进行格式化,并在浏览器窗口中显示。

一个经典问题:在浏览器地址栏键入 URL,按下回车之后会经历什么?

  • 浏览器向 DNS 服务器请求解析该 URL 中域名对应的 IP 地址;
  • 解析出 IP 地址后,根据该 IP 地址和默认端口 80,和服务器建立 TCP 连接
  • 服务器发出读取文件的HTTP请求(URL 中域名后面部分对应的文件),该请求报文作为 TCP 三次握手的第三个报文的数据发送给服务器;
  • 服务器对浏览器请求作出响应,并把对应的 HTML 文本发送给浏览器
  • 释放 TCP 连接
  • 浏览器将 HTML 文档渲染并显示内容;

HTTP 八种请求方式

GET:获取资源。可以理解为 “取”的意思,对应select操作。用来获取数据的,只是用来查询数据,不对服务器的数据做任何的修改,新增,删除等操作。
POST:传输实体主体。可以理解为 “贴”的意思。数据发送到服务器以创建或更新资源,侧重于更新数据,对应update操作。post请求的请求参数都是请求body中。
PUT:传输文件。可以理解为“放”的意思。数据发送到服务器以创建或更新资源,侧重于创建数据,对应insert操作。
HEAD:获取报文首部。无需传输整个内容
DELETE:删除文件
OPTIONS:询问支持的方法
TRACE:追踪路径
CONNECT:要求用隧道协议连接代理

1、GET:向指定的资源发出“显示”请求。使用GET方法应该只用在读取数据,而不应当被用于产生“副作用”的操作中,例如在Web Application中。其中一个原因是GET可能会被网络蜘蛛等随意访问。
2、HEAD:与GET方法一样,都是向服务器发出指定资源的请求。只不过服务器将不传回资源的本文部分。它的好处在于,使用这个方法可以在不必传输全部内容的情况下,就可以获取其中“关于该资源的信息”(元信息或称元数据)。
3、PUT:向指定资源位置上传其最新内容。
4、POST:向指定资源提交数据,请求服务器进行处理(例如提交表单或者上传文件)。数据被包含在请求本文中。这个请求可能会创建新的资源或修改现有资源,或二者皆有。
5、TRACE:回显服务器收到的请求,主要用于测试或诊断。
6、OPTIONS:这个方法可使服务器传回该资源所支持的所有HTTP请求方法。用’*'来代替资源名称,向Web服务器发送OPTIONS请求,可以测试服务器功能是否正常运作。
7、DELETE:请求服务器删除Request-URI所标识的资源。
8、CONNECT:HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。通常用于SSL加密服务器的链接(经由非加密的HTTP代理服务器)。
注意:

方法名称是区分大小写的。当某个请求所针对的资源不支持对应的请求方法的时候,服务器应当返回状态码 405(Method Not Allowed),当服务器不认识或者不支持对应的请求方法的时候,应当返回状态码 501(Not Implemented)。

GET 提交的数据大小有限制(因为浏览器对 URL 的长度有限制),而 POST 方法提交的数据没有限制.

状态码

HTTP 状态码被分成了“五”大类,不同的类型代表不同类别的状态码。

在这里插入图片描述

  • 24
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值