互联网,实际上是一套理念和协议组成的体系架构。其中,协议是一套众所周知的规则和标准,如果各方都同意使用,那么它们之间的通信将变得毫无障碍。
IP:把数据包送达目的主机数据包要在互联网上进行传输,就要符合网际协议(IP)标准,互联网上不同的在线设备都有唯一的地址,地址只是一个数字,这和大部分家庭收件地址类似,你只需要知道一个家庭的具体地址,就可以往这个地址发送包裹,这样物流系统就能把物品送到目的地。计算机的地址就称为IP地址,访问任何网站实际上只是你的计算机向另外一台计算机请求信息。如果要把一个数据包从主机A发送给主机B,那么在传输之前,数据包上会被附加上主机B的IP地址信息,这样在传输过程中才能正确寻址。
额外的,数据包上还会附加上主机A本身的IP地址,有了这些信息主机B才可以回复信息给主机A。这些附加的信息会被装进一个叫IP头的数据结构里。IP头是IP数据包开头的信息,包含IP版本,源IP地址,目标IP地址,生存时间等信息。
UDP:把数据包送达应用程序IP是非常底层的协议,只负责把数据包传送到对方电脑,但是对方电脑并不知道把数据包交给哪个程序,是交给浏览器还是交给王者荣耀?因此,需要基于IP之上开发能和应用打交道的协议,最常见的是“用户数据包协议”简称UDP。UDP中一个最重要的信息是端口号,端口号其实就是一个数字,每个想访问网络的程序都需要绑定一个端口号。通过端口号UDP就能把指定的数据包发送给指定的程序了,所以IP通过IP地址信息把数据包发送给指定的电脑,而UDP通过端口号把数据包分发给正确的程序。和IP头一样,端口号会被装进UDP头里面,UDP头再和原始数据包并组成新的UDP数据包。UDP头中除了目的端口,还有源端口号等信息
UDP不能保证数据可靠性,但是传输速度却非常快,所以UDP会应用在一些关注速度,但不会那么严格要求数据完整性的领域。如在线视频、互动游戏等。TCP:把数据完整地送达应用程序对于浏览器请求,或者邮件这类要求数据传输可靠性的应用,如果使用UDP来传输会存在两个问题:数据包在传输过程中容易丢失;大文件会被拆分成很多小的数据包来传输,这些小的数据包会经过不同的路由,并在不同的时间到达接收端,而UDP协议并不知道如何组装这些数据包,从而把这些数据包还原成完整的文件,基于这两个问题,我们引入了TCP。
TCP:是一种面向连接的,可靠的,基于字节流的传输通信协议。相对于UDP,TCP有下面俩个特点:对于数据包丢失的情况,TCP提供重传机制,TCP引入了数据包排序机制,用来保证吧乱序的数据包组合成一个完整的文件。和UDP头一样,TCP除了头部包含了目标端口和本级端口号外,还提供了用于排序的序列号,以便接收端通过序号来重排数据包。
下面我们再看下完整的TCP连接过程,通过这个过程你可以明白TCP是如何保证重传机制和数据包的排序功能的。
从上图可以看出,一个完整的TCP连接的生命周期包括了建立连接、传输数据、关闭连接三个阶段。首先建立连接阶段。这个阶段是通过“三次握手”来建立客户端和服务器之间的连接。TCP提供面向连接的通信传输。面向连接是指在数据通信开始之前先做好两端之间的准备工作。所谓三次握握手,是指在建立一个TCP连接时,客户端和服务器总共要发送三个数据包以确认连接的建立。其词,传输数据阶段。在该阶段,接收端需要对每个数据包进行确定操作,也就是接收端在接收到数据包之后,需要发送确认数据包给发送端。所以当发送端发送了一个数据包之后,在规定时间内没有接收到接收端反馈的确认信息,则判断为数据包丢失,并触发发送端的重发机制。同样,一个大的文件在传输过程中会被拆分成很多小的数据包,这些数据包到达接收端后,接收端会按照TCP头部的序号为其排序,从而保证组成完整的数据。最后,断开连接阶段。数据传输完毕之后,就要终止连接了,涉及到最后一个阶段“四次挥手”来保证双方都能断开连接。TCP为了保证数据传输的可靠性,牺牲了数据包的传输速度,因为“三次握手”和“数据包校验机制”等把传输过程中的数据包的数量提高了一倍。