引言
本文档描述了基于arm内核微控制器或微处理器的应用程序的热管理方法。微控制器或微处理器是基于硅基的集成电路,都有明确定义的存储和工作温度范围。
MCU的温度范围包括:最大工作温度范围和产品工作温度范围。最大工作温度范围定义了超过该温度阈值时,MCU有很高可能性遭受永久性损坏的温度。工作温度范围定义了超过该温度阈值时,电气参数不能保证在规格范围内的温度。通常来说,MCU的最大规定工作范围指的是结温,而工作温度范围指的是环境温度,也可能指的是结温。 在半导体行业中,通过参考环境温度或结温来指定工作温度范围是常见的做法。根据MCU及其功耗,半导体供应商会使用这些温度中的一个来指定产品的工作环境温度范围。
“结温”(junction temperature)通常指的是半导体器件内部的热节点温度,而“环境温度”(ambient temperature)则指的是MCU工作的周围环境温度。半导体设备的性能和可靠性很大程度上取决于它们工作时的温度,因此,了解和遵守这些温度范围对于确保设备正常运行和延长其使用寿命至关重要。
1. 热系统定义和基本概念
本节详细介绍了E/E系统热设计相关的基本定义和概念,特别适用于硅基集成电路(ICs)。
1.1 热系统定义
热能:在不同温度作用下,两个不同物体之间自发交换的能量量。
温度:一个物体有多热或多冷的比较性测量。一个给定物体的温度随着它吸收热量而上升,随着它释放热量而下降。
温度梯度:指的是一个物体内部不同位置之间的不均匀温度分布。温度梯度的大小反映了物体内部从一个位置到另一个位置的温度差异。
热阻:材料在一定温度梯度下传导一定量热量的性质。
1.2 热系统研究
热系统的设计采用了复杂的热模型和先进的仿真软件工具。这些模型和工具用于获得准确的结果。 为了以可接受的精度解决热系统问题,并减少计算工作量,可以使用许多简化假设(例如,考虑热阻与温度无关)。使用这些假设,热系统的学习类似于电气系统的学习,在电气系统中,热量等同于电流,温度等同于电压,热阻等同于电阻。
图1. 电气和热系统领域的类比
上述模型在电子行业中广泛认可的热模型,大多数半导体厂商根据这个简化模型,按照标准化机构(如JEDEC EIA/JESD 51-X标准)的规定,提供他们封装产品的热阻参数。设计人员在处理他们的应用中的散热问题时,或者至少在早期阶段,在选择给定产品的合适封装时,会考虑所提供的热阻参数。
1.3 热模型的芯片载体
下面提供的图为一个LQFP封装的MCU的简化热模型。图中展示了所有表面温度和热阻(根据JEDEC EIA/JESD 51-X标准定义)。
图2. 芯片载体的热模型
表1. 热参数
符号 | 描述 | 单位 |
---|---|---|
TJ | 裸晶(芯片)的温度 | °C |
TA | 周围空气的温度 | °C |
TC | 封装外壳的温度 | °C |
TB | 接近设备处的板(基板)的温度 | °C |
θJC | 裸晶与封装外壳之间的热阻 | °C/W |
θJB | 裸晶与印刷电路板(PCB)之间的热阻 | °C/W |
θJA | 裸晶与周围空气之间的热阻 | °C/W |
PB | 通过板耗散的功率 | W |
PC | 通过封装顶部耗散的功率 | W |
PT | 设备总耗散功率 (PT = PB + PC) | W |
2. MCU热参数
这一节详细解释了MCU数据手册中规定的MCU热参数。
2.1 环境温度
在电子领域,对于环境温度的标准和统一定义并没有共识。 可以肯定的是,环境温度是指设备周围环境的温度,但测量它的方法有很多。 测量参数,如测量点与设备之间的距离,周围空气是否静止,测试环境的体积,可能会严重影响后续结果的解释。 JEDEC提供了环境温度的标准定义,但该定义仅限于在确定封装热特性时使用的JEDEC测试环境。 大多数情况下,应用操作条件与JEDEC环境相差很大,这使得JEDEC定义的结点到环境温度(Θ-JA)的热阻对于高性能高功率耗散设备来说并不实用。
2.2 结点温度
结点温度是一个广泛使用的术语,用来指代裸晶(芯片)的温度。显然,裸晶温度是要考虑的最重要的温度,因为设备的所有电气参数都依赖于这个结点温度。实际上,结点温度是在确定设备可靠性时考虑的温度。 理论上,裸晶温度并不是在整个裸晶上均匀分布的。裸晶上存在一个温度梯度。在实践中,通常认为裸晶温度是均匀分布的,并且只提供一个单一的温度测量。当裸晶尺寸相对较小的时候,这种将温度梯度简化为一个温度读数的做法会引入一个小的不确定性。对于大多数MCU来说,按照均匀分布考虑结温是足够的。
2.3 环境温度与结点温度
环境温度和结点温度都指定了MCU的热性能。 对于许多微控制器来说,只有最大环境温度被指定为它们的热性能限制。有时也会加上结点温度。
使用环境温度来评估热性能比使用结点温度要容易得多,因为封装设备的裸晶是不可接近的。这使得传统的温度测量方法无法用于测量裸晶温度。 测量结点温度需要更先进的测量技术。大多数MCU都嵌入了一个结点温度传感器,它是热看门狗实现的基础硬件。但在设计阶段,这个嵌入的温度传感器无法帮助确定整个应用的热性能。相反,在设计阶段估计结点温度。它基于许多参数,包括应用功率配置文件、设备热阻、周围温度(板温度和设备外壳温度)。为了准确估计结点温度,当最终应用具有复杂的热模型和复杂的功率配置文件时,会使用建模软件工具。
2.4 外壳温度
外壳温度是用作芯片载体的封装顶部的温度。JEDEC标准规定,温度传感器必须使用1毫米的导电环氧树脂放置在封装顶部的中心。 如果封装外壳到环境的热阻远高于封装结点到外壳的热阻(至少一个数量级),并且由于大多数设备通过板耗散功率,如果可以接受一定的温度误差,可以将结点温度与外壳温度等同使用。
2.5 板温度
由JEDEC标准定义的板温度,是在设备最长边的中心引脚附近测量的印制电路板(PCB)温度。板温度和封装结点到板的热阻是评估设备热性能时非常关键的参数。
在稳定空气条件下,设备产生的大部分热量是通过板耗散的。通过板耗散的热量可能是通过封装顶部耗散的热量的20倍。例如,在JEDEC高导热测试板和稳定空气条件下,设备功率耗散的95%是通过板传递的,只有5%是通过封装顶部耗散的。
2.6 MCU热参数
大多数MCU数据手册只提供了ΘJA(结点到环境的热阻)参数,但有些也指定了ΘJC(结点到封装外壳的热阻)和ΘJB(结点到PCB的热阻),这些参数在下表中定义。
表2. MCU热阻
热参数指标 | 符号 | 值 | 主要用途 |
---|---|---|---|
结点到环境的热阻 | θJA (Theta‑JA) | Tj - TA | 在JEDEC环境中用来评估封装性能 |
结点到封装顶部的热阻 | θJC (Theta‑JC) | Tj - TC | |
结点到板的热阻 | θJB (Theta‑JB) | Tj - TB | 在2R模型(2R = 两个电阻)的仿真中使用 |
这些参数是在以下特定条件下确定的,这些条件与最终应用条件不同:
- ΘJA(结点到环境的热阻):JEDEC51-2文档《集成电路热测试方法环境条件 - 自然对流(静止空气)》描述了定义ΘJA的热测试方法。
- ΘJB(结点到板的热阻):JEDEC51文档《集成电路热测试方法环境条件 - 结点到板》描述了定义ΘJB的热测试方法。
- ΘJC(结点到封装顶部的热阻):MIL-STD-883E文档《微电路测试方法标准》描述了定义ΘJC的热测试方法。 这些热阻在半导体封装和设备上下文中必须被仔细定义。 关于这些值最重要的是,设备耗散的总功率在以下两个“点”之间流动:
- 结点
- 环境或板温度 系统中没有额外的并行热路径允许部分热量“泄漏”。离开结点的所有热量最终都到达或通过另一个点。 通常可以知道设备的总功率耗散,但要了解热量的哪一部分通过封装顶部流出,哪一部分通过引脚流出,以及哪一部分通过封装下的空气间隙流出则要困难得多。 ΘJC和ΘJB通常被用作热仿真工具的输入,这些工具计算热量的哪一部分通过设备的顶部和底部流出。
在设计半导体器件时,了解和准确测量这些热阻参数对于确保设备的热管理和性能至关重要。ΘJA、ΘJB和ΘJC提供了不同路径上的热阻值,它们是热设计和仿真的关键输入参数。通过这些参数,工程师可以模拟和预测器件在实际应用中的热行为,从而设计出有效的散热解决方案,以满足设备的热性能要求。
3. 功率耗散和冷却方法
本节提供了针对MCU的应用设计的热分析及改善建议:
- 功率耗散及其随PVTA(工艺、电压、(结点)温度和活动)变化的因素
- 如何最小化功耗
- 如何优化热耗散
3.1 功率耗散
MCU功率消耗的电流有两种类型:
- 静态电流:也称为泄漏电流,取决于工艺、电压和结点温度,但不依赖于活动
- 动态电流:取决于工艺、电压和活动,但不依赖于结点温度(至少在初步近似中是这样)
静态/泄漏电流随着结点温度呈指数增长(而动态电流不会显著变化)。
因此,总电流可以如下表示:
𝐼总(𝑃,𝑉,𝑇𝑗,活动)=𝐼静态(𝑃,𝑉,𝑇𝑗)+𝐼动态(𝑃,𝑉,活动)
耗散的功率随PVTA条件而变化。它通过设备上产生的电压和(平均)消耗的电流的乘积来计算。
结点温度相对于环境温度的升高是通过耗散功率和结点到室温热阻的乘积来计算的。 结点温度必须保持低于由以下等式给出的最大目标:
𝑇𝑗=𝑇室温+𝑃耗散×Θ𝑗,室温<𝑇𝑗,最大
注意:在这个仅用于教学目的的简化公式中,Theta_j_room是一个复杂的系数,它不是设备特性,而是系统特性(设备 + 其他组件 + 板 + 外壳)。
保持结点温度低于环境温度的方法讨论:
- 限制P耗散
- 限制Theta_j_room(冷却系统、主机板和外壳设计)
3.2 最小化功耗(P耗散)
为了减少功耗,首先要降低供电电压。ARM架构的很多MCU提供了多电源域架构,允许不同的电源域设置为低功耗模式。目标是优化能效(详见相应的数据手册以获取更多详细信息)。 功耗配置文件也随着应用而变化。一些应用大部分时间处于空闲模式,仅在事件发生时才以全速或有限容量工作。其他一些则需要定期的工作负载。 对于这些不同的功率配置文件,用户程序员可以通过软件启用低功耗模式。 下面列出了最常见的可用模式:
- 电源门控:通过切断不在使用中的电路部分的电流来减少功耗。
- 时钟门控:通过关闭电路或时钟树的一部分的时钟来减少动态功率耗散。
- 动态电压调节:根据情况增加或减少电压的功率管理技术。
- 动态频率调节(也称为节流,当应用于CPU时):根据实际需要,频率自动调整以节省电力并减少产生的热量。
3.2 功率耗散随结点温度的变化
假定工艺、电压和活动因素保持不变,重点讨论结点温度的影响。 静态/泄漏电流随着结点温度呈指数增长(而动态电流不会显著变化)。 功率耗散随结点温度变化有以下主要后果:
- 必须实施冷却解决方案,以限制结点温度低于125°C(最大结点温度)。
- 如果冷却系统不够高效,设备可能会进入热失控状态,这可能是破坏性的。 在设计阶段进行系统级热仿真时,输入依赖于结点温度的功率耗散是至关重要的。
热失控风险 结点到室温热阻,Theta_j_room,表征了设计中的冷却系统。 这种热阻提供了在限制结点温度的同时在设计中耗散功率的能力。 以下方程给出了散热能力(HDC):
HDC=(𝑇𝑗−𝑇室温)/Theta_j_room
图3. HDC(散热能力)
案例 1 下图显示了在给定的结点温度(TJ)下,设计内部可以耗散的功率曲线(HDC)与设计内部实际耗散的功率曲线(Pdiss)的交点处的工作点。
图4. 散热能力与结点温度依赖的耗散功率(案例 1)
在这个案例中,讨论的是在特定结点温度下,设计能够耗散的最大功率(HDC)与实际耗散功率(Pdiss)之间的关系。这种分析对于热设计和热管理至关重要,因为它帮助确定在不同工作条件下,设备的热安全极限和冷却需求。
在图4中,曲线的交点代表了设备的热平衡点,即在该点,设计能够耗散的功率等于实际耗散的功率。如果实际耗散的功率超过了HDC,结点温度将上升,可能导致过热和热失控。相反,如果实际耗散的功率低于HDC,结点温度将保持在较低水平,设备可以在安全的工作温度下运行。
案例 2 下图显示了室温增加(不改变任何其他因素)的效果。
图5. 散热能力与结点温度依赖的耗散功率(案例 2)
案例2讨论了冷却设计安全性的评估,特别是在达到最大室温时,设备是否能够保持在安全的结点温度以下,以避免热失控现象。热失控是一个严重的风险,它可能导致设备损坏或故障。
案例 3 下图显示了结点到室温热阻增加(不改变任何其他因素)的效果。
图6. 散热能力与结点温度依赖的耗散功率(案例 3)
在这个案例中,讨论的是结点到室温热阻(Theta_j_room)增加对散热能力(HDC)和结点温度依赖的耗散功率(Pdiss)的影响。结点到室温热阻是衡量冷却系统效能的关键参数,它描述了热量从设备结点传递到周围环境的难易程度。
如果结点到室温热阻增加,意味着热量传递到周围环境的效率降低,这将导致在相同的功率耗散条件下,结点温度升高。如果冷却系统不能有效散热,设备可能会工作在更高的温度下,增加热失控的风险。
案例 4 下图显示了功率耗散减少(不改变任何其他因素)的效果。
图7. 散热能力与结点温度依赖的耗散功率(案例 4)
在这段描述中,强调了在案例 2(室温增加)和案例 3(结点到室温热阻增加)中,由于HDC曲线与Pdiss曲线没有交点,系统无法达到一个稳定的工作状态,这是热失控的一种情况。热失控可能由于多种因素引起,包括环境温度升高或散热能力下降。
案例 4 讨论了在不改变其他条件的情况下,通过减少功率耗散对系统热性能的影响。减少功率耗散可以直接降低设备产生的热量,从而有助于降低结点温度,避免热失控的风险,并可能使得系统能够在一个更安全的温度范围内工作。
4. 冷却
4.1 功率耗散路径
由裸晶耗散的功率沿着以下两条主要路径提取:
- 顶部:通过顶部耗散的功率(通过散热片,并通过可选的热界面材料(TIM))
- 底部:通过PCB从底部耗散的功率(通过底部金属板,并通过可选的TIM)
图8. 功率耗散路径
散热器的设计通常包括鳍片(fins)或其他结构,以最大化其表面积,从而提高热传递效率。它们可以是被动的,仅依赖于物理过程来散发热量,或者可以是主动的,使用风扇或其他机械手段来增强对流。
4.2 主要冷却方法
散热器和PCB通过对流和辐射方法将功率耗散到周围环境中。
4.2.1 自然对流
当外壳中没有使用风扇时,使用术语“自然对流”。这种冷却方法是自然对流和辐射的结合,它们始终并行工作。这是一种被动冷却技术,依赖于周围空气的自然流动来带走热量。这种流动通常是由设备产生的热量引起的温度差异驱动的。自然对流通常与辐射一起发生,因为设备在耗散热量的同时也会发出热辐射。
4.3.2 强制对流
当外壳中使用风扇时,使用术语“强制对流”。这是一种主动冷却技术,通过使用风扇或其他机械手段来增加空气流动,从而提高热量的耗散效率。强制对流可以显著提高冷却效率,特别是在高功率耗散或空间受限的应用中。
4.2.3 自然对流与强制对流的比较
下表详细列出了自然对流和强制对流之间的主要比较因素。
表3. 自然对流与强制对流的比较
比较因素 | 自然对流 | 强制对流 |
---|---|---|
冷却效率 | 中到高 | 更高(取决于空气流速) |
成本 | 低(无风扇) | 较高(风扇的成本) |
可靠性 | 高(无运动部件) | 较低(有运动的机械部件) |
声学噪声 | 无 | 有(风扇运行产生) |
根据需求控制冷却效率的可能性 | 是,可通过调节风扇电压来实现 | |
底部冷却 - 主机PCB设计 | 中到高 | 高 |
4.3 通过PCB设计实现底部散热
由于PCB是设备的次级散热器,因此为了提供足够多的“热通孔”来实现散热,设计人员需要使用推荐的层叠结构并优化封装下方的PCB布局。 通过对PCB设计过程中的接地和电源连接的设计规则进行优化,对PCB的冷却和功率分配具有重要的作用。 但不可能为PCB内的层构造制定一套刚性规则,因为每个设计都有其自身的特定要求。
4.3.1 PCB接地和电源布局
地线(GND)平面必须在所有PCB区域具有低电阻(热和电),这将显著提高了信号质量和功率耗散,同时良好的地平面设计还可以有效减少电磁干扰(EMI)。使用地平面布局并通过多个通孔连接到其他层,以保持地平面电阻在非常低的水平。 为了散热,要求PCB布局时,在封装下方的地线和电源平面上放置尽可能多的热通孔,确保在相邻通孔之间有足够的连续铜材用于功率分配和热耗散,在通孔和铜材铺设之间必须找到一种折衷方案。 可能的热通孔如下所列:
- 地通孔:连接GND到统一的GND平面(这些是最高效的热通孔)
- 电源通孔:连接电源到电源平面
热通孔将热量从设备传导到内部GND和电源平面。这些平面在PCB内部传播热量,充当平面散热器。在PCB设计中实现有效热管理的关键因素,包括热通孔的使用、地线和电源布局的优化。热通孔是从PCB的一层到另一层的垂直通道,它们不仅有助于电子连接,还能提高热传导效率。地线平面和电源平面的设计对于确保良好的热性能和电磁兼容性(EMC)至关重要。通过在封装下方布置足够的热通孔,可以提高热量从设备到PCB的传导效率,从而提高整个系统的热稳定性和可靠性。
在外层上增加额外的接地(GND)区域
在PCB的外层上,在没有功能走线的地方可以增加一些接地(GND)区域。只要可能,就通过通孔网络将这些区域连接到GND。 这些GND区域有助于沿板进行热扩散和耗散。下图展示了额外GND区域和通向GND平面的通孔的原理。
图9. 额外GND区域和通向GND平面的通孔的原理
5. 总结
电子热设计是电子设备设计过程中的一个关键方面,对于确保设备的性能、可靠性和使用寿命具有重要意义。
- 重要性:随着电子设备的集成度提高和功耗增加,热量管理成为保证设备稳定运行的首要问题。电子热设计通过有效的散热措施,控制设备温度,防止过热引起的性能下降、故障甚至损坏。
- 设计原则:电子热设计需要综合考虑设备的功耗、结构、环境等因素,选择合适的散热方式(如自然风冷、强制风冷、液体冷却等),并合理布局散热元件,以最小化热阻,提高散热效率。
- 设计步骤:通常包括熟悉元器件参数、选择散热方法、进行散热计算、优化散热结构等步骤。设计过程中需要密切关注元器件的结温、功耗等关键参数,确保设备在各种工作条件下都能保持适宜的温度。
- 应用领域:电子热设计广泛应用于各种电子设备、汽车、航空航天、能源系统等领域,对于提高设备的性能和可靠性具有重要意义。
电子热设计是电子设备设计中不可或缺的一部分,对于确保设备在各种工作条件下的稳定性和可靠性具有至关重要的作用。