目录
HTTP协议
-
全称:超文本传输协议(HyperText Transfer Protocol)
-
HTTP是一个基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)。
-
HTTP是一个属于应用层的面向对象的协议,由于其简捷、快速的方式,适用于分布式超媒体信息系统。
-
HTTP协议工作于客户端-服务端架构为上。浏览器作为HTTP客户端通过URL向HTTP服务端即WEB服务器发送所有请求。Web服务器根据接收到的请求后,向客户端发送响应信息。
什么是超文本(hyper text)?
超文本是用超链接的方法,将各种不同空间的文字信息组织在一起的网状文本。超文本更是一种用户界面范式,用以显示文本及与文本之间相关的内容。现时超文本普遍以电子文档方式存在,其中的文字包含有可以链结到其他位置或者文档的连结,允许从当前阅读位置直接切换到超文本连结所指向的位置。超文本的格式有很多,最常使用的是超文本标记语言(标准通用标记语言下的一个应用)及富文本格式。
什么是URL?
统一资源定位符(Uniform Resource Locator)”简称为URL。URL是web页的地址,这种地址会在浏览器顶部附近的Location或者URL框内显示出来
URL由两个主要的部分构成
协议(Protocol)和目的地(Destination)。
URL和URL的区别
URI,是uniform resource identifier,统一资源标识符,用来唯一的标识一个资源。
Web上可用的每种资源如HTML文档、图像、视频片段、程序等都是一个来URI来定位的 URI一般由三部组成:
-
访问资源的命名机制
-
存放资源的主机名
-
资源自身的名称,由路径表示,着重强调于资源。
HTTP协议的方法
-
GET: 请求获取Request-URI所标识的资源
-
POST: 在Request-URI所标识的资源后增加新的数据
-
HEAD: 请求获取由Request-URI所标识的资源的响应消息报头
-
PUT: 请求服务器存储或修改一个资源,并用Request-URI作为其标识
-
DELETE: 请求服务器删除Request-URI所标识的资源
-
TRACE: 请求服务器回送收到的请求信息,主要用于测试或诊断
-
CONNECT: 保留将来使用*
OPTIONS
: 请求查询服务器的性能,或者查询与资源相关的选项和需求
HTTP响应状态码
状态代码有三位数字组成,第一个数字定义了响应的类别,且有五种可能取值
-
1xx:指示信息 - 表示请求已接收,继续处理
-
2xx:成功 - 表示请求已被成功接收、理解、接受
-
3xx:重定向 - 要完成请求必须进行更进一步的操作
-
4xx:客户端错误 - 请求有语法错误或请求无法实现
-
5xx:服务器端错误 - 服务器未能实现合法的请求
常见状态代码、状态描述、说明
-
200: OK - 客户端请求成功
-
301:永久重定向,请求的资源更改了URL,响应中给出了新的URL
-
302:临时重定向
-
304:浏览器缓存中的内容和nginx服务器中的内容一致
-
400: Bad Request - 客户端请求有语法错误,不能被服务器所理解
-
401: Unauthorized - 请求未经授权,这个状态代码必须和
WWW-Authenticate
报头域一起使用 -
403: Forbidden - 服务器收到请求,但是拒绝提供服务
-
404: Not Found - 请求资源不存在,eg:输入了错误的URL
-
500: Internal Server Error - 服务器发生不可预期的错误
-
502:Bad Gateway 网关故障,负载均衡是好的,后端的real server挂掉了
-
503: Server Unavailable - 由于临时服务器维护或者过载,服务器当前不能处理客户端的请求,一段时间后,可能恢复正常或则和限制了某个时间段只能访问多少次
HTTP的五大特点
-
支持B/S及C/S模式。
-
简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。
-
灵活:HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
-
无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。
-
无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。
HTTP的工作原理
HTTP报文结构
请求报文
-
host:表示访问哪个网址 --》URL
-
user-agent:使用的用户代理 --》浏览器
-
cookit
-
connetction
响应报文
GET和POST的区别
-
get请求一般是去取获取数据(其实也可以提交,但常见的是获取数据); post请求一般是去提交数据。
-
get因为参数会放在url中,所以隐私性,安全性较差,请求的数据长度是有限制的,不同的浏览器和服务器不同,一般限制在 2~8K 之间,更加常见的是 1k 以内;post请求是没有的长度限制,请求数据是放在body中;
-
get请求刷新服务器或者回退没有影响,post请求回退时会重新提交数据请求。
-
get请求可以被缓存,post请求不会被缓存。
-
get请求会被保存在浏览器历史记录当中,post不会。get请求可以被收藏为书签,因为参数就是url中,但post不能。它的参数不在url中。
-
get请求只能进行url编码(appliacation-x-www-form-urlencoded),post请求支持多种(multipart/form-data等)。
深入理解
-
GET 和 POST都是http请求方式, 底层都是 TCP/IP协议;通常GET 产生一个 TCP 数据包;POST 产生两个 TCP 数据包(但firefox是发送一个数据包),
-
对于 GET 方式的请求,浏览器会把 http header 和 data 一并发送出去,服务器响应 200(返回数据)表示成功;
而对于 POST,浏览器先发送 header,服务器响应 100, 浏览器再继续发送 data,服务器响应 200 (返回数据)。