摘 要
随着运营商网络的云化和集约化部署,研究防控由于网络故障引发的信令风暴已成为保护移动通信网网络安全的重要课题。通过针对核心网前后端信令放大效应的研究及流控模型的构建,制定了核心网前端精准流控和分级流控的部署策略;同时,结合核心网对终端、基站引导机制的研究,构建了可以指导运营商有效防护信令风暴的端到端流控方案。
0 1
概 述
近2年境外运营商发生了多例大规模网络故障,故障期间出现的网元过载拥塞和信令风暴导致故障影响范围大、持续时间长,对用户的个人权益和运营商的品牌形象产生了较大的负面影响。2022年7月,某境外运营商移动网核心路由器割接失败后回退,大量终端集中发起注册导致PCRF/HSS过载,进而引发信令风暴,经核心网和无线网的手动流控后仍无法压制信令风暴,故障持续时间超过60 h。
多起故障案例表明,网络故障发生时的DC容灾倒换和故障恢复后的用户集中注册是引发信令风暴的2类主要原因。经实验室模拟,极端故障场景下注册浪涌对移动核心网的冲击达到常规注册模型的100倍,大量用户集中发起注册可能引发网元拥塞和业务劣化,用户业务失败后的反复重试引发设备过载,进一步导致正常用户业务受影响引发冲击蔓延,最终发生信令风暴。
网元部署自保流控是防护信令风暴的重要手段,但随着运营商5G用户的