HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web)服务器传输超文本到本地浏览器的传送协议。
HTTP是基于TCP/IP通信协议来传递数据(HTML文件、图片文件、查询结果等)。
1.HTTP协议工作原理
HTTP协议工作于客户端-服务器架构上,浏览器作为HTTP客户端通过URL向HTTP服务端即WEB服务器发送所有请求。
Web服务器有:Apache服务器,IIS(Internet Information Services)等。
Web服务器根据接收到的请求,向客户端发送响应信息。
HTTP默认端口号为80,但是你也可以改为8080或者其他端口。
例如:在浏览器地址栏键入URL,按下回车之后会经历以下流程:
- 浏览器向 DNS 服务器请求解析该 URL 中的域名所对应的 IP 地址
- 解析出 IP 地址后,根据该 IP 地址和默认端口 80,和服务器建立TCP连接
- 浏览器发出读取文件(URL 中域名后面部分对应的文件)的HTTP 请求,该请求报文作为 TCP 三次握手的第三个报文的数据发送给服务器
- 服务器对浏览器请求作出响应,并把对应的 html 文本发送给浏览器
- 释放 TCP连接
- 浏览器将该 html 文本并显示内容
2.HTTP协议特点
- HTTP是无连接的:无连接的含义是限制每次连接只处理一个请求,服务器处理完客户的请求,并收到客户的应答后,即断开连接,采用这种方法可以节省传输时间。
- HTTP是媒体独立的:这意味着,只要客户端和服务器知道如何处理数据内容,任何类型的数据都可以通过HTTP发送。客户端以及服务器指定使用适合的MIME-type内容类型。
- HTTP是无状态的:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力,缺少状态意味着如何后续处理需要前面的信息,则必须重传,这样可能导致每次连接传送的数据量增大,另一方面,在服务器不需要先前信息时,它的应答就较快。
3.HTTP消息结构
HTTP是基于C/S的架构模型,通过一个可靠的链接来交换信息,是一个无状态的请求/响应协议。
一个HTTP“客户端”是一个应用程序(Web浏览器或任何其他客户端),通过连接到服务器达到向服务器发送一个或多个HTTP请求的目的。
一个HTTP“服务器”同样是一个应用程序(通常是一个Web服务),通过接收客户端的请求并向客户端发送HTTP响应数据。
HTTP使用统一资源标识符(Uniform Resource Identifiers,URI)来传输数据和建立连接。一旦建立连接后,数据消息就通过类似Internet邮件所使用的格式[RFC5322]和多用途Internet邮件扩展(MIME)[RFC2045]来传送。
1)客户端请求信息
客户端发送一个HTTP请求到服务器的请求信息包括以下格式:请求行(request line)、请求头部(header)、空行和请求数据四个部分组成,下图给出了请求报文的一般格式:
使用POST来传递数据的客户端请求:
HTTP请求头只出现在HTTP请求中,请求报头允许客户端向服务端传递请求的附加信息和客户端自身信息:
- Host 请求报头域主要用于指定被请求资源的Internet主机和端口。
- User-Agent 请求报头域允许客户端将它的操作系统、浏览器和其他属性告诉服务器。
- Referer 包含一个URL,代表当前访问URL的上一个URL,也就是说,用户是从什么地方来到本页面。当前请求的原始URL地址。
- Cookie 是非常重要的请求头,常用来表示请求者的身份等。
- Accept 这个消息头用于告诉服务器客户端愿意接受那些内容,比如图像类,办公文档格式等等。
2)服务器响应信息
HTTP响应也是由四部分组成,分别是:状态行、消息报头、空行和响应正文:
响应头是服务器根据请求向客户端发送的HTTP头:
- Date 表示当前的GMT时间。
- Content-Length 表示内容长度。
- Content-Type 表示后面的文档属于什么MIME类型。Servlet默认为text/plain,但通常需要显式地指定为text/html。
- Server 服务器名字。Servlet一般不设置这个值,而是由Web服务器自己设置。
- Set-Cookie 设置和页面关联的Cookie。
4.HTTP请求方法
根据HTTP标准,HTTP请求可以使用多种请求方法。
HTTP1.0定义来了三种请求方法:GET、POST和HEAD方法。
HTTP1.1新增了六种请求方法:OPTIONS、PUT、PATCH、DELETE、TRACE和CONNECT方法。
5.HTTP状态码
当浏览者访问一个网页时,浏览者的浏览器会向网页所在服务器发出请求,当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含HTTP状态码的信息头(server header)用以响应浏览器的请求。
下面是常见的HTTP状态码:
-
200(OK)—请求成功。一般用于GET与POST请求
-
301(Moved Permanently)—资源(网页等)被永久转移到其他URL
-
404(Not Found)—请求的资源(网页等)不存在
-
505—内部服务器错误
HTTP状态码由三个十进制数字组成,第一个十进制数字定义了状态码的类型,后两个数字没有分类的作用,HTTP状态码共分为5种类型: