数据中心基础设施三大件:计算、存储和网络。
计算: 计算和存储技术近些年都有长足的进步,其中,计算在CPU基础上,出现了像GPU、TPU等为特定场景、特定业务而生的处理器芯片,计算效率成百上千的提升;
存储: 存储在HDD机械硬盘的基础上,出现了SSD全闪存产品,存取效率也得到质的飞跃。
**网络:**而网络虽然出现了SDN技术,但其内核本质还是TCP/IP技术,而TCP/IP处理机制是“尽力而为”,涉及“TCP/IP协议栈处理时延大”和“因协议栈处理机制带来的CPU负载居高不下的问题”,并没有太大的改进:
TCP/IP协议栈处理时延大:
1 TCP协议栈在收/发报文时,需要做多次上下文切换,每次切换需耗费5μs~10μs左右时延;
2 以及至少三次的数据拷贝,严重依赖CPU进行协议封装,协议栈本身就有数十微秒的固定时延,使得在AI人工智能和SSD分布式存储-微秒级系统中,协议栈时延成为最明显的瓶颈;
服务器CPU负载居高不下:
1 除固定时延问题,TCP/IP还需主机CPU多次参与协议栈内存拷贝。网络规模越大,网络带宽越高, CPU在收发数据时的调度负担越大,导致CPU持续高负载。
2 按照业界测算数据:每传输1bit数据需要耗费1Hz的CPU资源;当网络带宽达到25G以上(满载),绝大多数服务器,至少50% CPU资源将不得不用来传输数据。
参考文献:
1 https://zhuanlan.zhihu.com/p/396579324