1.问题引入
一个客户端通过一个交换机与数据中心相连,交换机又与多个服务器相连,客户端向n个服务器请求一个较大的数据块。如下图所示:
每个数据块都分割到这些服务器上,因此每个服务器都存储了一个较小的数据块。接收端为了得到较大的数据块,向每个服务器发送一个请求,服务器收到请求后,就以一种多对一的模式通过瓶颈链路向接收端发送数据。只有在所有请求的服务器数据都被客户端成功收到,该请求才算完成,客户端才能请求下一个数据块。但是,随着同时参与数据同步传输的服务器数目的增加,大量的数据流量会涌向交换机与客户端之间的瓶颈链路。这些流量会导致瓶颈链路上交换机的缓冲区的溢出,引起大量丢包事件,以及随后的数据重传,最终导致吞吐量的急剧下降。
2.问题出现的原因
正是由于高带宽链路,低传播时延,以及有限的交换机缓冲区导致了TCP Incast 问题的出现。首先,由于高带宽和低时延,在需要数据的客户端向存储数据的服务器发送数据请求后,这些服务器几乎同时向客户端发送数据,导致大量数据流同时涌向网络。又由于交换机缓冲区空间有限,这种流量很容易就会将其溢出,接着发生丢包,TCP 通过超时重传进行恢复。超时的时间通常至少要几百毫秒。需要超时重传的服务器会进入超时等待。由于同步的传输模式,多个服务器可能会同时进入这种等待。因此在等待的这段时间内,链路几乎处于完全空闲状态,这就导致链路的不充分利用,以及吞吐量的急剧下降。
3.问题的解决
我解决问题的办法是:出现啥问题?是什么原因导致的?就想办法去解决这个原因。
1.因为会发生丢包问题,我们可以从这一点去思考这个问题。由于缓冲区空间小导致的丢包,我们可以稍微扩大缓冲区的空间来解决这个问题。
2.这些数据基本上都是同时在发送,我们是否可以给它一个先后秩序来发送数据,这样也能避免大量数据同时涌进一条链路。
3.增大服务器内的数据块大小,在网上有说明。增大数据块的大小就使得数据块平均分割到较小数目的存储服务器上,这样客户端就可以向较少的服务器请求同样的小的数据块。