TCP
TCP是基于连接的。就像打电话,电话接通、相互通话、结束挂断这一些列过程都能得到及时的反馈,并且能够确认对方准确的接收到。
TCP是如何保证以上过程的?有三个步骤:三次握手、传输确认、四次挥手。
三次握手
三次握手是建立连接的过程。当客户端向服务器发起连接时,会发一包连接请求数据过去询问一下,能否与你建立连接,这包数据我们称之为SYN包。如果对端同意连接,则回复一包SYN + ACK包。客户端收到之后回复一包ACK包。连接建立。这个过程互相发送了三包数据,称之为三次握手。
为什么是三次握手而不是两次握手?
这是了防止已失效的请求报文,突然又传到服务器引起错误。
这是什么意思呢?
假设采用两次握手建立连接。客户端向服务端发送了一个SYN包来建立连接,因为某些未知的原因并没有到达服务器,在中间某个网络节点发生了滞留。为了建立连接,客户端会重新发送SYN包,这次SYN包成功送达,服务端回复SYN + ACK之后建立起了连接。
但是!!
第一包数据阻塞的网络节点突然恢复,第一包SYN包又送达到服务端,服务端会认为是客户端又发起的一次新的连接。从而两次握手之后会进入数据等待状态。
服务端认为是两个连接,客户端认为是一个连接,造成了状态不一致。如果是三次握手的话,服务端收不到最后的ACK包,自然不会认为建立连接成功。
所以!!
三次握手本质上来说就是为了解决网络信道不可靠的问题,为了在不可靠的信道上建立可靠的连接。
数据传输
经过三次握手之后,客户端和服务端都进入了数据传输状态。
TCP需要在不可靠的信道上保证可靠的连接,现在就有几个问题需要面对:
一包数据有可能被拆成多包发送,如果处理丢包问题?如何处理乱序问题?
针对这些要求,TCP为每一个连接建立了一个发送缓冲区。从建立连接的第一个序列号为0,后面每一个字节的序列号就会加1,发送数据时取一部分数据组成发送报文,在其TCP协议头中会附带序列号和长度,接收端在接收到数据后需要回复确认报文,确认报文中的ACK等于接受序列号加长度,也就是下一包数据需要发送的起始序列号。
这样一问一答的方式,能够确保发送端发送的数据已被对方收到,发送端也可以一次发送多包数据,接收端只需要回复一次ACK就可以了。这样发送端可以把待发送的数据分成多个碎片发送到对端,对端在接收到数据之后重构出完整的数据。
假如中间丢失了部分数据,则接收端可以要求发送端重新发送
以上过程不区分客户端还是服务端,TCP是全双工的。
四次挥手
处于连接状态的客户端和服务端,都可以发起关闭连接请求。
假如客户端主动发起关闭连接请求,它需要向服务端发送一包FIN包,表示要关闭连接,自己进入终止等待1状态,这是第一次挥手。
服务端收到FIN包,发起一包ACK包,表示自己进入关闭等待状态。客户端进入终止等待2状态,这是第二次挥手。服=服务端此时还可以发送未发送的数据,客户端还可以接受数据。
待服务端发送完数据之后,发送一包FIN包,进入最后确认状态。这是第三次挥手。
客户端收到之后回复ACK包,进入超时等待状态,经过超时时间后关闭连接,而服务端收到ACK包后立即关闭连接。这是第四次挥手。
为什么客户端要等待超时时间??
这是为了确保对方收到ACK包,如果假设客户端在发送完ACK包就释放的连接,一旦ACK包在网络红丢失,服务端将一直停留在最后确认状态。如果客户端发送完ACK后等待一段时间,这是服务端因为没有收到ACK包会重发FIN包,客户端会响应这个FIN包重发ACK包,刷新超时时间。
四次挥手机制和三次握手一样,也是为了在不可靠的网络链路中进行可靠的连接断开确认。
UDP
UDP是基于非连接的。类似于写信。
UDP发送数据就是把数据包封装一下,然后从网卡发出去就可以了,数据包之间没有状态上的联系。这是UDP这种简单的处理方式导致它的性能损耗非常少。对于cpu,内存资源的占有也远小于TCP,但是对于网络传输中产生的丢包,UDP并不能保证,所以UDP在传输稳定性上要弱于TCP。
区别
TCP
- 传输数据可靠,适用于对网络通讯质量要求较高的场景。
- 需要准确无误的传输给对方。比如传输文件、发送邮件、浏览网页等
UDP
- 速度快,但是可能产生丢包。
- UDP有一个非常重要的场景就是隧道网络,比如vpn。
- 适用于对实时性要求较高但是对少量丢包并没有太大要求的场景。比如域名查询 语音通话 视频直播等。