http原理
要理解Http原理首先得知道TCP/IP协议
计算机与网络设备之间如果要相互通信,双方就必须基于相同的方法,比如如何探测到通信目标,由哪边发起通信,使用哪种语言进行通信,怎样结束通信,都需要提前确定好,所以需要一种规则,称为协议。
TCP和IP都是分层管理的,分别为应用层,传输层,网络层,数据链路层,物理层,分层之后,对于后期需要改进的地方,可以进行快速的改进,无需全部替换,只需将变动层替换即可
具体分层如下所示:
- 物理层:负责信息在节点之间的传输,本层协议和链路有关,也与传输介质有关,
- 数据链路层:控制网络层与物理层之间的通信,保证物理线路上进行可靠的数据传递
- 网络层:决定如何将数据方路由发给接收方,综合考虑优先权,网络拥塞程度以及可选路由的花费等 去决定传输的最佳途径,即建立主机到主机之间的通信。
- 传输层:为两台主机上的应用程序提供端到端的通信,通常有两个传输协议TCP和UDP,TCP是一个可靠的面向连接的协议,UDP是无连接的协议
- 应用层:应用程序受到传输层的数据后,接下来需要进行解读,事先必须规定好格式,而应用层就是规定应用程序的数据格式,主要的协议有HTTP,FTP等。
TCP的三次握手和四次挥手
三次握手:
- 建立链接,客户端发送链接请求报文段,并将标志位设为1,数据包序列为x,等待服务端确认,客户端进行SYN_SENT状态;
- 服务端受到客户端的SYN报文段,对其进行确认,设置ack为x+1,同时发送SYN请求,将SYN设置为1,seq设置为y,服务端将上述所有信息放到SYN+ACK报文段中,一并发送给客户端,此时服务器进入SYN_RECV状态
- 客户端收到服务端的SYN+ACK报文段之后,将ACK设置为y+1,向服务端ACK报文段,这个报文段发送完毕后,客户端和服务端都进入ESTABLISHED状态,完成三次握手
四次挥手: - 客户端设置seq和 ACK ,向服务器发送一个 FIN(终结)报文段。此时,客户端进入 FIN_WAIT_1 状态,表示客户端没有数据要发送给服务端了
- 服务端收到了客户端发送的 FIN 报文段,向客户端回了一个 ACK 报文段
- 服务端向客户端发送FIN 报文段,请求关闭连接,同时服务端进入 LAST_ACK 状态。
- 客户端收到服务端发送的 FIN 报文段后,向服务端发送 ACK 报文段,然后客户端进入 TIME_WAIT 状态。服务端收到客户端的 ACK 报文段以后,就关闭连接。此时,客户端等待 2MSL(指一个片段在网络中最大的存活时间)后依然没有收到回复,则说明服务端已经正常关闭,这样客户端就可以关闭连接了
完整过程如下:
http协议
http原理
HTTP协议即超文本传输协议是Hyper Text Transfer Protocol的缩写。
HTTP协议是一种用于分布式、协作式和超媒体信息系统的应用层协议
HTTP是一个客户端终端(用户)和服务器端(网站)请求和应答的标准(TCP)。通过使用网页浏览器、网络爬虫或者其它的工具,客户端发起一个HTTP请求到服务器上指定端口(默认端口为80)。我们称这个客户端为用户代理程序(user agent)。应答的服务器上存储着一些资源,比如HTML文件和图像。我们称这个应答服务器为源服务器(origin server)。在用户代理和源服务器中间可能存在多个“中间层”,比如代理服务器、网关或者隧道(tunnel)。
http工作步骤
- 客户端连接到Web服务器
一个HTTP客户端,通常是浏览器,与Web服务器的HTTP端口(默认为80)建立一个TCP套接字连接。例如,http://www.baidu.com。 - 发送HTTP请求
通过TCP套接字,客户端向Web服务器发送一个文本的请求报文,一个请求报文由请求行、请求头部、空行和请求数据4部分组成。 - 服务器接受请求并返回HTTP响应
Web服务器解析请求,定位请求资源。服务器将资源复本写到TCP套接字,由客户端读取。一个响应由状态行、响应头部、空行和响应数据4部分组成 - 释放连接TCP连接
若connection 模式为close,则服务器主动关闭TCP连接,客户端被动关闭连接,释放TCP连接;若connection 模式为keepalive,则该连接会保持一段时间,在该时间内可以继续接收请求; - 客户端浏览器解析HTML内容
客户端浏览器首先解析状态行,查看表明请求是否成功的状态代码。然后解析每一个响应头,响应头告知以下为若干字节的HTML文档和文档的字符集。客户端浏览器读取响应数据HTML,根据HTML的语法对其进行格式化,并在浏览器窗口中显示。
例如在浏览器地址栏键入URL,按下回车之后会经历以下流程:
浏览器向 DNS 服务器请求解析该 URL 中的域名所对应的 IP 地址;
解析出 IP 地址后,根据该 IP 地址和默认端口 80,和服务器建立TCP连接;浏览器发出读取文件(URL 中域名后面部分对应的文件)的HTTP 请求,该请求报文作为 TCP 三次握手的第三个报文的数据发送给服务器;
服务器对浏览器请求作出响应,并把对应的 html 文本发送给浏览器;
释放 TCP连接;浏览器将该 html 文本并显示内容;