【数据中心传热过程和负荷计算(一)】

1. 数据中心发热设备的构成

数据中心设备的发热都是来自于电能的转换,下图为典型数据中心配电和冷负荷来源的构成。
典型数据中心配电和冷负荷来源构成
图中的部分是数据中心机房内设备引起的负荷,是要求我们重点去研究的。

2.数据中心发热设备发热分析

数据中心的发热设备主要包括IT设备、不间断电源UPS、配电系统(PDU,Power Distribution Unit 电源分配单元)、制冷设备、辅助设备等。下表描述典型数据中心上述各项发热量比例。

热源发电量比例
IT设备71%
UPS13%
照明10%
配电系统4%
人员2%

从上表可以看出,在组成数据中心的发热设备中,IT设备的发热量达到了70%以上,占据大部分。UPS、照明系统的发热量分别占13%和10%,配电系统仅占4%。所以对于一个数据中心而言,制冷系统所提供的冷量大部分消耗于冷却IT设备和UPS,并且在数据中心的实际运行中,这两部分的发热和负载有关,处于不断地变化中。

2.1 IT设备的发热分析

数据中心的IT设备指的是用于外界进行数据交换,可以进行大量数据存储、运算、通信和网络服务的设备。IT设备是由一个个数据机柜组成的,而数据机柜则是由服务器集中堆叠而成的。因此研究IT设备的发热特征从本质上来说就是研究服务器的发热特征。

2.2服务器的发热分析

1) 服务器的发热组成

服务器的发热组成大体可以由下表得到

组件能耗
CPU(中央处理器)CPU的功率通常以TDP(Thermal Design Power)表示,单位是瓦特。TDP代表了CPU在最大负载时预计会产生的热量,通常也可以视作其最大功率消耗。
内存功率(比较固定)每条内存条的功率:内存的功率消耗主要取决于容量、类型(DDR3、DDR4、DDR5等)和工作电压。常见的DDR4内存每GB大约消耗1.5W至3W的功率。
存储设备功率(硬盘、SSD)机械硬盘(HDD):机械硬盘的功率消耗一般在5W至10W之间,取决于转速(如7200 RPM或10000 RPM)。固态硬盘(SSD):SSD通常比HDD更节能,功率消耗通常在2W至5W之间。
网络接口(网卡)千兆网卡:通常消耗1W至2W。万兆网卡:通常消耗3W至10W
主板和其他组件主板:主板的功率消耗包括芯片组、电源管理模块等,通常在50W至100W之间,具体取决于主板的规格和所连接的设备;散热风扇:每个风扇的功率消耗通常在2W至10W之间,取决于尺寸和转速。
显卡独立显卡:显卡的功率消耗通常以TDP表示,类似于CPU。高性能显卡的TDP可能在100W到300W之间。集成显卡:功率通常较低,一般与主板的功耗合并计算。

值得一提的是,冷却风扇的设计是为了保证CPU和其他组件的温度处于正常范围内,其发热量通常可以忽略不计。但是冷却风扇通过叶片转动带动空气流动,经过服务器内部组件时吸收热量,最后回到机房环境中,从能量转化的角度来说,是将机械能最终转化为空气的热能。因此冷却风扇消耗的电能应算作服务器的发热量。

2) 服务器发热量和进口温度的关系

进口温度提高时,服务器的发热量也随之增加,这些功耗的增加是由下面的因素造成的。

  1. 服务器中冷却风扇的功耗增加,进口温度升高时,为了保证服务器核心温度,冷却风扇会提高转速,增加流量。
  2. 服务器中CPU泄漏功率增加,送风温度提高时,会使得CPU核心温度上升,导致CPU泄漏功率增加。
  3. 转换效率下降,温度的提升会引起服务器电子组件效率下降,从而引起能耗增加。

3) 服务器发热量和服务器负载率的关系

服务器实际运行负载率一直是动态变化的过程,而服务器中的CPU发热量和负载率有很大的关系,致使服务器发热量具有动态特征。

4) 服务器的传热特征

典型的服务器传热过程,涵盖从芯片到机房空间的流动和换热,是很复杂的动态热过程。但是服务器中的核心部件CPU是主要发热源,因此为了分析主要矛盾去掉其他组件,简化服务器的构成。
服务器CPU的传热过程:CPU的硅晶片(DIE)就是承担运算功能的芯片,CPU的所有热量都是由此产生的。其产生热量的热传递路径有两条:

  1. 向下传递给印制电路板(PCB),可忽略不计
  2. 向上首先从硅晶片经过整体散热片(HS),中间途径热界面材料(TIM),之后传递给散热片(Heat Sink),这部分传热机理是热传导,最后由冷却风机带来的空气带走,这部分传热机理是热对流和热辐射。

3. 服务器的传热模型

CPU散热模型:
CPU的功率由三部分组成,即
  P CPU = P d + P s + P 0   \ P_{\text{CPU}} = P_d + P_s + P_0 \  PCPU=Pd+Ps+P0 
式中:
P CPU P_{\text{CPU}} PCPU ——CPU的功率(W);
P 0 P_0 P0 ——CPU的空载功率(W),即占用率 u = 0 u = 0 u=0 的时候CPU消耗的功率,在恒定供应电压下为常数。
P d P_d Pd ——动态功率(W)
P s P_s Ps ——静态功率(W)

其中,动态功率和三方面因素有关,即供电电压 V d d V_{dd} Vdd、开关电容量 C e C_e Ce 和时钟频率 f f f。其计算公式为:

P d = 0.5 × C e × V d d 2 × f P_d = 0.5 \times C_e \times V_{dd}^2 \times f Pd=0.5×Ce×Vdd2×f

对于供应电压恒定的CPU, V d d V_{dd} Vdd 是个常数,开关电容量一般来说也是个常数,时钟频率 f f f 的大小取决于CPU的占用率 u u u。因此上式可以简化为:

P d = c 1 × u P_d = c_1 \times u Pd=c1×u

式中:
c 1 c_1 c1 ——经验系数
u u u ——CPU占用率

P s P_s Ps 指的是静态功率,反映的是CPU泄漏电流导致的功率消耗,而泄漏电流大小取决于硅晶片温度 T d T_d Td,有学者用指数形式拟合 P s P_s Ps 如下式:

P s = c 2 × e c 3 × T d P_s = c_2 \times e^{c_3 \times T_d} Ps=c2×ec3×Td

式中:
c 2 , c 3 c_2, c_3 c2,c3 ——经验系数
T d T_d Td ——硅晶片温度

综合上式,CPU的功耗便可以计算出来。前面提到,服务器中除了CPU,还有其他组件,这些组件在服务器工作时也会散发热量,但对于CPU的散热量来说比较小,这里不考虑其变化视为常数。那么服务器发热量可以写成:

P server = P 1 + P 2 P_{\text{server}} = P_1 + P_2 Pserver=P1+P2

P 1 = a 0 + a 1 × u + a 2 × e a 3 × T d P_1 = a_0 + a_1 \times u + a_2 \times e^{a_3 \times T_d} P1=a0+a1×u+a2×ea3×Td

P 2 = P sfan P_2 = P_{\text{sfan}} P2=Psfan

式中:
P 1 P_1 P1 ——服务器中的组件散热
a 0 , a 1 , a 2 , a 3 a_0, a_1, a_2, a_3 a0,a1,a2,a3 ——拟合常数
P 2 P_2 P2 ——服务器中冷却风扇功耗

从CPU的硅晶片到空气的传热过程中,总热阻 R tot R_{\text{tot}} Rtot 由导热部分热阻 R ds R_{\text{ds}} Rds 和对流部分热阻 R sa R_{\text{sa}} Rsa 组成。在稳态条件下,如果CPU温度波动很小,导热部分热阻 R ds R_{\text{ds}} Rds 变化不大,可以视为常数,而 R sa R_{\text{sa}} Rsa 取决于空气流速 v v v,所以总热阻可以由下式计算:

R tot = a 4 + a 5 n a 6 R_{\text{tot}} = a_4 + \frac{a_5}{n^{a_6}} Rtot=a4+na6a5

冷却风扇的功耗取决于转速 n n n 的三次方,在这里直接用多项式拟合:

P sfan = a 7 × n 3 + a 8 × n 2 + a 9 × n P_{\text{sfan}} = a_7 \times n^3 + a_8 \times n^2 + a_9 \times n Psfan=a7×n3+a8×n2+a9×n

V sfan = a 10 × n V_{\text{sfan}} = a_{10} \times n Vsfan=a10×n

式中 V sfan V_{\text{sfan}} Vsfan 是冷却风扇的流量,与此同时,由热阻的定义可知:

R tot = T d − T amb P 1 R_{\text{tot}} = \frac{T_d - T_{\text{amb}}}{P_1} Rtot=P1TdTamb

服务器的出口温度由能量守恒条件可得,绝大部分功率都转化成热量,其效率 η = 0.99 \eta = 0.99 η=0.99,可由下式计算服务器出口温度:

T out = T in + η × P server c p , air × ρ air × V sfan T_{\text{out}} = T_{\text{in}} + \frac{\eta \times P_{\text{server}}}{c_{p,\text{air}} \times \rho_{\text{air}} \times V_{\text{sfan}}} Tout=Tin+cp,air×ρair×Vsfanη×Pserver

式中:
c p , air c_{p,\text{air}} cp,air 是空气的比热容;
ρ air \rho_{\text{air}} ρair 是空气的密度
V sfan V_{\text{sfan}} Vsfan 是冷却风扇的流量

考虑到从服务器到CPU之间的组件发热量很小,因此认为服务器进口空气温度和到达CPU空气温度相等,即

T amb = T in T_{\text{amb}} = T_{\text{in}} Tamb=Tin

由此便可建立关于服务器的准动态模型,虽然在传热学上是稳态的传热过程,但是考虑CPU占用率和CPU核心温度的影响,在实际运行时,输入不同时段的CPU占用率便可以得到动态的散热量,反映了服务器的动态发热特征。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值