为了理解 HTTP,有必要事先了解一下 TCP/IP 协议族。通常使用的网络(包括互联网)是在 TCP/IP 协议族的基础上运作的。而 HTTP 属于它内部的一个子集。
协议(protocol):
计算机与网络设备要相互通信,双方就必须基于相同的方法。比如,如何探测到通信目标、由哪一边先发起通信、使用哪种语言进行通信、怎样结束通信等规则都需要事先确定。所有的这一切都需要一种规则。而我们就把这种规则称为协议。
TCP/IP:
协议存在各式各样的内容,从电缆的规格到 IP 地址的选定方法、寻找异地用户的方法、双方建立通信的顺序,以及 Web 页面显示需要处理的步骤,等等。像这样把与互联网相关联的协议集合起来总称为 TCP/IP。
TCP/IP 协议族按层次分别分为以下 4 层:应用层、传输层、网络层和数据链路层。
应用层:向用户提供应用服务时通信的活动,如FTP,NDS
传输层:传输层支持着应用层,提供处于网络连接中的两台计算机之间的数据传输。如TCP,UDP
网络层:网络层用来处理在网络上流动的数据包。数据包是网络传输的最小数据单位。该层规定了通过怎样的路径(所谓的传输路线)到达对方计算机,并把数据包传送给对方。
链路层:用来处理连接网络的硬件部分,如网卡(NIC)
流程:利用 TCP/IP 协议族进行网络通信时,会通过分层顺序与对方进行通信。发送端从应用层往下走,接收端则往应用层往上走。如图:
发送端在层与层之间传输数据时,每经过一层时必定会被打上一个该层所属的首部信息。反之,接收端在层与层传输数据时,每经过一层时会把对应的首部消去。这种把数据信息包装起来的做法称为封装(encapsulate)。如图:
IP:
IP(Internet Protocol)网际协议位于网络层。有人会把“IP”和“IP 地址”搞混,“IP”其实是一种协议的名称。
IP 协议的作用是把各种数据包传送给对方。而要保证确实传送到对方那里,则需要满足各类条件。其中两个重要的条件是 IP 地址和 MAC地址(Media Access Control Address)。
IP 地址指明了节点被分配到的地址,MAC 地址是指网卡所属的固定地址。IP 地址可以和 MAC 地址进行配对。IP 地址可变换,但 MAC地址基本上不会更改。
IP 间的通信依赖 MAC 地址。通信的双方在同一局域网(LAN)内的情况是很少的,通常是经过多台计算机和网络设备中转才能连接到对方,而中转时候需要通过IP得到MAC,利用MAC来中转。而中转过程如图:
TCP:
TCP 位于传输层,提供可靠的字节流服务。
字节流服务(Byte Stream Service):为了方便传输,将大块数据分割成以报文段(segment)为单位的数据包进行管理。
可靠的:为了准确无误地将数据送达目标处,TCP 协议采用了三次握手(three-way handshaking)策略。如图:
DNS:
DNS(Domain Name System)服务是和 HTTP 协议一样位于应用层的协议。它提供域名到 IP 地址之间的解析服务。域名如:
(www.baidu .com)。与 IP 地址的一组纯数字相比,用字母配合数字的表示形式来指定计算机名更符合人类的记忆习惯。但计算机只擅长处理数字,所以就需要DNS转化一下。如图:
以上过程总结如图:
附:
URI 用字符串标识某一互联网资源,而 URL 表示资源的地点(互联网上所处的位置),所以 URL 是 URI 的子集。
URI格式:
注:整理自图解HTTP