前言:为了了解TCP/IP协议,我们先来简单介绍HTTP协议。
1. 什么是HTTP协议。
1.1 HTTP(HyperText Transfer Protocol,超文本传输协议),当我们在网页浏览器(web browser)的地址栏中输入URL时,web页面的展示就是使用HTTP协议作为规范,完成从客户端到服务器端等一系列的运行步骤,web应用是建立在HTTP协议上进行客户端到服务器端通信的。
1.2 HTTP协议规定,请求从客户端发出,最后服务器端响应请求并返回,也就说,请求肯定是先从客户端开始建立通信的,服务器端在没有接受到请求之前是不会发送响应的。
2. HTTP协议和TCP/IP协议的关系
通常使用的网络(包括互联网)是在TCP/IP协议族的基础上运作的,而HTTP属于TCP/IP内部的一个子集。
3. 网络基础 TCP/IP
3.1 TCP/IP协议族
计算机与网络设备要相互通信,双方就必须基于相同的方法。比如:如何探测到通信目标,由哪一边先发起通信,使用哪种语言进行通信,怎样结束通信等规则都需要事先确定。不同的硬件,操作系统之间的通信,所有的这一切都需要一种规则。而我们就把这些规则称为协议(protocol)。
这些协议包括:TCP,IP,DNS,FTP,HTTP,UDP,这些是常见的一些协议,还有一些例如PPPoE,ICMP,FDDI,SNMP。
协议中存在各式各样的内容,从电缆的规格到IP地址的选定方法,寻找异地用户的方法,双方建立通信的顺序,以及web页面显示需要处理的步骤等等。
像这样把与互联网相关联的协议集合起来总称为TCP/IP。当然了,TCP/IP协议的称呼还有别的说法,例如,TCP/IP是指TCP和IP两种协议,还有TCP/IP是指在IP协议的通信过程中,使用到的协议族的统称。
3.2 TCP/IP 的分层管理
TCP/IP协议族里重要的一点就是分层。TCP/IP协议族按层次分别分为下面四个层次:
应用层,传输层,网络层,数据链路层。
TCP/IP协议分层次的好处:例如如果互联网只由一个协议统筹,某个地方需要修改设计时,就必须把整个换掉,这点类似于分布式项目部署,修改哪个模块,只要重新发布这个模块即可,而不用重新发布整个项目,耗时费力。
把各层之间的接口部分规划好之后,每个层次内部的设计就能够自由改动了。
层次化之后,设计也变得相对简单了。处于应用层上的应用只需要考虑分配给自己的任务,而不需要弄清对方在地球上哪个地方,对方的传输路线是怎样的,是否能确保传输送达等问题。
下面依次介绍各个层级。
应用层:应用层决定了向用户提供应用服务时通信的活动。TCP/IP协议族内准备了各类通用的应用服务。例如FTP(File Transfer Protocol,文件传输协议),DNS(Domain Name System,域名系统),HTTP协议就是在这个层级。
传输层:传输层对上层应用层,提供处于网络连接中的两台计算机之间的数据传输。在传输层有两个性质不同的协议:TCP(Transmission Control Protocol,传输控制协议)和UDP(User Data Protocol,用户数据报协议)。
网络层(网络互连层):网络层用来处理在网络上流动的数据包。数据包是网络传输的最小数据单位。该层规定了通过怎样的路径(所谓的传输路线)到达对方计算机,并把数据包传送给对方。与对方计算机之间通过多台计算机或网络设备进行传输时,网络层所起的作用就是在众多的选项内选择一条传输路线。
数据链路层(网络接口层):用来处理连接网络的硬件部分。包括控制操作系统,硬件的设备驱动,网络适配器(网卡),以及光纤等物理可见部分,硬件上的范畴均在链路层的作用范围之内。
3.3 TCP/IP通信传输流
利用TCP/IP协议族进行网络通信时,会通过分层顺序与对方进行通信。发送端从应用层往下走,接收端则从应用层往上走。
我们使用HTTP来说明整个通信流程:
首先作为发送端的客户端在应用层(HTTP协议)发出一个想看某个web页面的HTTP请求。
然后,为了传输方便,在传输层(TCP协议)把应用层出收到的数据(HTTP请求报文)进行分割,并在各个报文上打上标记序号以及端口号后转发给网络层。
在网络层(IP协议),增加作为通信目的地的MAC地址后转发给链路层。这样一来,发送网络的通信请求就准备好了。
接收端的服务器在链路层接收到数据,按序往上层发送,一直到应用层,当传输到应用层,才能算是真正接受到由客户端发送过来的HTTP请求。
在装包的时候,每一层都会增加一些信息用于传输,这部分信息就叫报头,当上层的数据到达本层的时候,会将数据加上本层的报头打包在一起,继续往下传递。
在拆包的时候,每一层将本层需要的报头读取后,就将剩下的数据往上传。