网页访问流程原理
HTTP 协议简介
何为HTTP
HTTP协议,全称超文本传输协议。HTTP则是浏览器与服务器之间交流的一种规范。HTTP基于TCP/IP协议,属于应用层的协议。
为什么Web应用不使用TCP或者UDP协议呢?
TCP基于连接和三次握手,像C/S架构的网站,最多上千个Client同时连接,而B/S架构的网站,十万人同时在线是很平常的,如果十万个客户端同时与服务器保持连接,服务器会承载不了。UDP则是一种不可靠且不安全的协议,无法满足Web应用的要求。
于是衍生出HTTP协议。HTTP请求结束后,服务器立即关闭连接,释放资源。
HTTP 工作原理
-
由客户端向服务器发起一个HTTP请求,请求建立一个到服务器指定端口(默认80)的TCP连接。
-
服务器在指定端口(默认80)接收到客户端发来的HTTP请求。
-
服务器向客户端发回一个状态行(比如"HTTP/1.1 200 OK"),和响应的消息。
-
客户端接收到服务器返回的信息,并把内容显示在屏幕上,然后与服务器断开连接。
HTTP 三点注意事项
- HTTP是无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。
- HTTP是媒体独立的:这意味着,只要客户端和服务器知道如何处理的数据内容,任何类型的数据都可以通过HTTP发送。客户端以及服务器指定使用适合的MIME-type内容类型。
- HTTP是无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。
HTTP 消息结构
-
HTTP是基于客户端/服务端(C/S)的架构模型,通过一个可靠的链接来交换信息,是一个无状态的请求/响应协议。
-
一个HTTP"客户端"是一个应用程序(Web浏览器或其他任何客户端),通过连接到服务器达到向服务器发送一个或多个HTTP的请求的目的。
-
一个HTTP"服务器"同样也是一个应用程序(通常是一个Web服务,如Apache Web服务器或IIS服务器等),通过接收客户端的请求并向客户端发送HTTP响应数据。
-
HTTP使用统一资源标识符(Uniform Resource Identifiers, URI)来传输数据和建立连接。
-
一旦建立连接后,数据消息就通过类似Internet邮件所使用的格式[RFC5322]和多用途Internet邮件扩展(MIME)[RFC2045]来传送。
客户端请求消息
客户端发送一个HTTP请求到服务器的请求消息包括以下格式:请求行(request line)、请求头部(header)、空行和请求数据四个部分组成,下图给出了请求报文的一般格式
服务器响应消息
HTTP响应也由四个部分组成,分别是:状态行、消息报头、空行和响应正文
代码示例
下面代码发送了3次http请求
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Title</title>
</head>
<body>
<h1>hello</h1>
<img src="1.jpg" width="100px">
<img src="2.jpg" width="100px">
</body>
</html>
下面代码发送了2次http请求
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Title</title>
</head>
<body>
<h1>hello</h1>
<img src="1.jpg" width="100px">
<img src="1.jpg" width="100px">
</body>
</html>