SONiC系统的散热控制

文章探讨了随着网络设备功耗增加带来的散热挑战,提到了液体冷却和水冷的极端散热方案。重点介绍了SONiC系统如何通过温度检测、风扇管理以及定义散热Policy来应对高功耗问题,包括风扇速度控制和异常情况下的自动化响应策略。
摘要由CSDN通过智能技术生成
现在的网络设备功耗越来越大,动辄几百瓦的功耗对设备内部的散热设计提出了很大的挑战。极端的解决方案是把整个设备浸泡在液体里面,通过液体相变散热,或者液体的流动带走热量。这样做可以达到非常高的功率密度,但是对电子设备的设计和用于导热的液体也提出了很高的要求。或者采用水冷的方式,通过管道将低温的水引导到每个芯片上的水冷散热器上,通过管道内部的水流经散热器带走热量。这种方式对管道接头提出了很高的要求,需要在水管连接或者拔掉的过程中没有液体滴漏。
SONiC对设备散热控制方面也提供了一些独特的设计,首先是大功耗器件的温度检测,通过平台API按60秒为间隔采集芯片温度信息,话说60S是不是太长了,有异常出现的时候,经过60S芯片都烧掉了。
按照SONiC有数据库为核心的设计方法,对应定义了温度监控的DB schema,不仅仅是探测到的温度,还包括门限,采样时刻,告警状态等等。
风冷系统控制温度的方法是控制风扇的转速,风扇转速随温度升高而升高,SONiC定义了FAN对象来管理风扇。对应的管理过程通过syslog记录下来。
这些都是常规的系统散热设计,SONiC系统的特点是支持散热设计的Policy定义和管理。
Policy的方法是定义一套规则,如果规则的触发调节被满足了,那么规则被自动触发,规则可以很灵活,系统提供工程默认配置,同时也支持用户自定义。
甚至可以触发Python程序的执行。
一个SONiC系统的散热规则如下
    "thermal_control_algorithm": {
        "run_at_boot_up": "true",
        "fan_speed_when_suspend": "60"
    },
    "info_types": [
        {
            "type": "fan_info"
        },
        {
            "type": "psu_info"
        },
        {
            "type": "chassis_info"
        }
    ],
    "policies": [
        {
            "name": "any fan absence",
            "conditions": [
                {
                    "type": "fan.any.absence"
                }
            ],
            "actions": [
                {
                    "type": "thermal_control.control",
                    "status": "false"
                },
                {
                    "type": "fan.all.set_speed",
                    "speed": "100"
                }
            ]
        },
        {
            "name": "any psu absence",
            "conditions": [
                {
                    "type": "psu.any.absence"
                }
            ],
            "actions": [
                {
                    "type": "thermal_control.control",
                    "status": "false"
                },
                {
                    "type": "fan.all.set_speed",
                    "speed": "100"
                }
            ]
        },
        {
            "name": "any fan broken",
            "conditions": [
                {
                    "type": "fan.any.fault"
                }
            ],
            "actions": [
                {
                    "type": "thermal_control.control",
                    "status": "false"
                },
                {
                    "type": "fan.all.set_speed",
                    "speed": "100"
                }
            ]
        },
        {
            "name": "all fan and psu presence",
            "conditions": [
                {
                    "type": "fan.all.presence"
                },
                {
                    "type": "psu.all.presence"
                },
                {
                    "type": "fan.all.good"
                }
            ],
            "actions": [
                {
                    "type": "thermal_control.control",
                    "status": "true"
                }
            ]
        }
    ]
}

SONiC系统如何解析规则,调用系统功能等下次再研究 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值