协议是指计算机通信网络中两台计算机之间进行通信所必须共同遵守的规定或规则。
HTTP协议(HyperText Transfer Protocol超文本传输协议),它是基于TCP协议的应用层传输协议,是一种通信协议,允许将超文本标记语言(HTML)文档从Web服务器传送到客户端的浏览器。简单来说就是客户端和服务端进行数据传输的一种规则。
客户端通过与服务端建立TCP连接,之后发送HTTP请求与接收HTTP响应都是通过访问Socket接口来调用TCP协议实现。
1. HTTP协议的主要特点
- 支持客户/服务器模式。
- 简单快速:客户端向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户端与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。
- 灵活:HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
- 无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户端的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。
- 无状态:HTTP协议是无状态协议。无状态是指协议对于事物处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大;另一方面,在服务器不需要先前信息时它的应答就较快。
URL,统一资源定位符,又叫做网页地址。如:https://www.csdn.net/
URI,统一资源标识符,以特定语法标识的一个资源的字符串。如:schema:schema-specific-part
URN,统一资源名称。如:urn:ISBN:123456789
2. HTTP之URL
HTTP URL (URL是一种特殊类型的URI,包含了用于查找某个资源的足够的信息)的格式如下:
http://host[":"port][abs_path]
http-->表示要通过HTTP协议来定位网络资源
host-->表示合法的Internet主机域名或者IP地址
port-->指定一个端口号,为空则使用缺省端口80
abs_path-->指定请求资源的url;如果url中没有给出abs_path,那么当它作为请求url时,必须以“/”的形式给出,通常这个工作浏览器自动帮我们完成。
3. HTTP之请求-响应过程
HTTP 协议采用请求/响应模型。客户端向服务器发送一个请求报文,服务器以一个状态作为响应。
以下是HTTP请求/响应的步骤:
- 客户端连接到web服务器:HTTP 客户端与web服务器建立一个 TCP 连接;
- 客户端向服务器发起 HTTP 请求:通过已建立的TCP 连接,客户端向服务器发送一个请求报文;
- 服务器接收 HTTP 请求并返回 HTTP 响应:服务器解析请求,定位请求资源,服务器将资源副本写到 TCP 连接,由客户端读取;
- 释放 TCP 连接:若connection 模式为close,则服务器主动关闭TCP 连接,客户端被动关闭连接,释放TCP 连接;若connection 模式为keepalive,则该连接会保持一段时间,在该时间内可以继续接收请求;
- 客户端浏览器解析HTML内容:客户端将服务器响应的 html 文本解析并显示。
以上就是请求-响应的全过程。
4. HTTP之请求报文
HTTP协议的请求报文主要由请求行、请求头部、空行 和 请求包体 4个部分组成。
4.1 请求行
每个报文的请求行都是由三个字段组成:请求方法、URL字段和HTTP版本字段。
常用的HTTP请求常用方法有:
序号 | 方法 | 描述 |
---|---|---|
1 | GET | (当客户端要从服务器中读取某个资源时) 请求指定的页面信息,并返回实体主体。 |
2 | POST | (当客户端给服务器提供信息较多时)向指定资源 提交数据进行处理请求。数据被包含在请求体中。POST请求可能会导致新的资源的建立和/或已有资源的修改。 |
实例讲解:
访问网址10.6.3.104,抓包看到如上数据。
分析:
方法 | URL | 版本 |
---|---|---|
POST | /user/login | HTTP/1.1 |
4.2 请求头部
请求头部由关键字/值对组成,每行一对,关键字和值用英文冒号“:”分隔。请求头部通知服务器有关于客户端请求的信息。
实例展示:
4.3 空行
最后一个请求头之后是一个空行,发送回车符和换行符,通知服务器以下不再有请求头。
4.4 请求包体
请求包体不在GET方法中使用,而是在POST方法中使用。POST方法适用于需要客户填写表单的场合。与请求包体相关的最常使用的是包体类型Content-type和包体长度Content-length。
5. HTTP之响应报文
HTTP响应报文由状态行、响应头部、空行 和 响应包体4个部分组成。
5.1 状态行
状态行由 HTTP 协议版本字段、状态码和状态码描述 3 个部分组成,他们之间使用空格隔开。
-
状态码由三位数字组成,第一位数字表示响应的类型,常用的状态码有五大类如下所示:
1xx:表示服务器已接收了客户端请求,客户端可继续发送请求;
2xx:表示服务器已成功接收到请求并进行处理;
3xx:表示服务器要求客户端重定向;
4xx:表示客户端的请求有非法内容;
5xx:表示服务器未能正常处理客户端的请求而出现意外错误;
-
状态码描述文本有如下取值:
200 OK:表示客户端请求成功;
400 Bad Request:表示客户端请求有语法错误,不能被服务器所理解;
401 Unauthonzed:表示请求未经授权,该状态代码必须与 WWW-Authenticate 报头域一起使用;
403 Forbidden:表示服务器收到请求,但是拒绝提供服务,通常会在响应正文中给出不提供服务的原因;
404 Not Found:请求的资源不存在,例如,输入了错误的URL;
500 Internal Server Error:表示服务器发生不可预期的错误,导致无法完成客户端的请求;
503 Service Unavailable:表示服务器当前不能够处理客户端的请求,在一段时间之后,服务器可能会恢复正常;
5.2 响应头部
通常为键值对结构,通过 : 空格 分割。
实例展示:
5.3 空行
响应头结束的标志。
5.4 响应包体
服务器返回给客户端的文本信息,通常为 JSON 格式。
实例展示: