HTTP协议入门详解
本文为HTTP协议的讲解,主要讲述URL,HTTP请求与响应,与HTTPS的区别于联系。
HTTP简介
HTTP协议
(超文本传输协议HyperText Transfer Protocol),它是基于TCP协议的应用层传输协议,简单来说就是客户端和服务端进行数据传输的一种规则。
注:客户端与服务器的角色不是固定的,一端充当客户端,也可能在某次请求中充当服务器。这取决与请求的发起端。HTTP协议属于应用层,建立在传输层协议TCP之上。客户端通过与服务器建立TCP连接,之后发送HTTP请求与接收HTTP响应都是通过访问Socket接口来调用TCP协议实现。
HTTP 是一种无状态
(stateless) 协议, HTTP协议本身不会对发送过的请求和相应的通信状态进行持久化处理。这样做的目的是为了保持HTTP协议的简单性,从而能够快速处理大量的事务, 提高效率。客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。
HTTP URL
HTTP协议是一个基于请求和应答模式的,存在于传输层之上的应用层协议,是一个无状态的协议,通常是基于TCP的连接方式.HTTP的URL是一种特殊类型的URI,包含了用于定位查找某个网络资源的路径,格式如下:
http://host[':'port][abs_path]
http表示通过http协议来定位网络资源; host表示合法的Internet主机域名或者IP地址; port指定一个端口,如果缺省,默认是80端口;abs_path表示的是请求的资源的URL,如果什么都没写,则浏览器会帮我们加上‘/’,作为初始的路径地址.
HTTP请求(Request)
如下图,HTTP请求由三部分组成:请求行,请求头,请求正文(数据);
下图为一个具体的请求报文:
①是请求方法,HTTP协议的请求方法有:GET: 请求获取Request-URI所标识的资源; POST: 在Request-URI所标识的资源后增加新的数据; HEAD: 请求获取由Request-URI所标识的资源的响应消息报头; PUT: 请求服务器存储或修改一个资源,并用Request-URI作为其标识; DELETE: 请求服务器删除Request-URI所标识的资源; TRACE: 请求服务器回送收到的请求信息,主要用于测试或诊断; CONNECT: 保留将来使用; OPTIONS: 请求查询服务器的性能,或者查询与资源相关的选项和需求; 其中GET和POST是最常见的HTTP方法,当前的大多数浏览器只支持GET和POST。
②为请求对应的URL地址,它和报文头的Host属性组成完整的请求URL,③是协议名称及版本号。①、②和③构成HTTP的请求状态行,请求行由请求Method,URL字段和HTTP Version三部分组成,总的来说请求行就是定义了本次请求的请求方式和,请求的地址,以及所遵循的HTTP协议版本,例如:
GET /example.html HTTP/1.1 (CRLF)
④是HTTP的报文头,报文头包含若干个属性,格式为“属性名:属性值”,服务端据此获取客户端的信息,其中一些常见的请求头属性为:
HTTP响应(Response)
下图为HTTP响应的数据图,HTTP响应也由三部分组成,包括状态行,消息报头,响应正文。
第一部分:状态行,由HTTP/1.1(协议版本)200(状态码)OK(状态码的描述)构成
第二部分:响应头,由一些键值对购车航,用来说明客户端要使用的一些附加信息
第三部分:响应正文,服务器返回给你客户端的文本信息
HTTP响应状态码
状态码有三位数字组成,第一个数字定义了响应的类别,且有五种可能取值:
1××:指示信息—表示请求已接受哦,继续处理
2××:成功—表示请求已被成功接受、理解、接受
3××:重定向—要完车请求必须进行更进一步的操作
4××:客户端错误—请求有语法错误或者请求无法实现
5××:服务器端错误—服务器未能实现合法的请求
常见的一些状态码、状态描述、说明:
200:OK-客户端请求成功
400:Bad Request-客户端请求有语法错误,不能被服务器所理解
401:Unauthorized-请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用
403:Forbidden - 服务器收到请求,但是拒绝提供服务
404:Not Found - 请求资源不存在,eg:输入了错误的URL
500:Internal Server Error - 服务器发生不可预期的错误
503:Server Unavailable - 服务器当前不能处理客户端的请求,一段时间后,可能恢复正常
HTTP协议的工作原理、特点与请求/响应步骤
工作原理
HTTP协议定义了web客户端如何从web服务器请求Web页面,以及服务器如何把Web页面传送给客户端.HTTP协议采用了请求/响应模型.客户端向服务器发送一个请求报文,请求报文包括请求的方法,url,协议版本,请求头部和请求数据.服务器以一个状态行作为响应,响应的内容包括协议的版本,成功或者错误代码,服务器信息,响应头部和响应数据
特点
1.支持客户/服务器模式。
2.简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。
3.灵活:HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
4.无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。早期这么做的原因是请求资源少,追求快。后来通过Connection: Keep-Alive实现长连接(持久连接与非持久连接:在实际的应用中,客户端往往会发出一系列请求,接着服务器端对每个请求进行响应。对于这些请求|响应,如果每次都经过一个单独的TCP连接发送,称为非持久连接。反之,如果每次都经过相同的TCP连接进行发送,称为持久连接。)
5.无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快
请求/响应步骤
- 客户端连接到服务器
- 发送HTTP请求
- 服务器接受请求分析后返回HTTP响应
- 释放TCP连接
- 客户端浏览器解析HTML内容
HTTP与HTTPS
HTTPS协议
(Hypertext Transfer Protocol Secure:超文本传输安全协议)是一种透过计算机网络进行安全通信的传输协议。HTTPS 经由 HTTP 进行通信,但利用 SSL(Secure Socket Layer, 安全套接层)/TLS(Transport Layer Security, 安全层传输协议) 来加密数据包。HTTPS 开发的主要目的,是提供对网站服务器的身份认证,保护交换数据的隐私与完整性。
HTTPS 默认工作在 TCP 协议443端口,它的工作流程一般如以下方式:
1、TCP 三次同步握手
2、客户端验证服务器数字证书
3、DH 算法协商对称加密算法的密钥、hash 算法的密钥
4、SSL 安全加密隧道协商完成
5、网页以加密的方式传输,用协商的对称加密算法和密钥加密,保证数据机密性;用协商的hash算法进行数据完整性保护,保证数据不被篡改。
区别
- HTTP 明文传输,数据都是未加密的,安全性较差,HTTPS(SSL+HTTP) 数据传输过程是加密的,安全性较好。
- 使用 HTTPS 协议需要到 CA(Certificate Authority,数字证书认证机构) 申请证书,一般免费证书较少,因而需要一定费用。证书颁发机构如:Symantec、Comodo、GoDaddy 和 GlobalSign 等。
- HTTP 页面响应速度比 HTTPS 快,主要是因为 HTTP 使用 TCP 三次握手建立连接,客户端和服务器需要交换 3 个包,而 HTTPS除了 TCP 的三个包,还要加上 ssl 握手需要的 9 个包,所以一共是 12 个包。
- http 和 https 使用的是完全不同的连接方式,用的端口也不一样,前者是 80,后者是 443。
- HTTPS 其实就是建构在 SSL/TLS 之上的 HTTP 协议,所以,要比较 HTTPS 比 HTTP 要更耗费服务器资源。
HTTPS工作原理与步骤
- 客户端发起HTTPS请求
- 服务端配置
- 传送证书
- 客户端解析证书
- 传送加密信息
- 服务端解密信息
- 传输加密后的信息
- 客户端解密信息
结语
以上就是我在HTTP的学习过程中,对自己学到的HTTP知识的一个梳理,希望看完本篇文章能对你在HTTP的学习过程中有所帮助。