5G网络行业切片SLA初探

“店长,你们58元工作餐送一杯咖啡,结果是一包速溶咖啡,真的好忽悠!”某西餐厅里,一位客户不满地说道。客户看到菜单里赠送的咖啡,立刻脑补了一杯热气腾腾的现磨阿拉比咖啡,但店长却想着“赠送的,用雀巢速溶咖啡就不错了”。结果换来的是某团上的差评。

“李经理,我们园区的5G摄像头上不了网了,什么时候可以恢复啊?”某工厂客户着急地打电话。“我刚看了下系统,你们的故障是18:30发生的,应该是刚才的雷暴天气导致基站故障。您购买的是我们的VIP级切片,可以享受7×24小时保障,故障修复将不超过2小时。现在19:05了,我们的工程师在半小时前就出发了,这会差不多就到你们厂了。放心,不用1小时网络就恢复了。”李经理安抚着客户,客户听李经理这么淡定准确的回答,着急的心情也慢慢平复下来。

上面的两个场景为何有如此反差?西餐厅里双方各自想当然,服务没有明确定义,争执不断。园区的客户在购买运营商的网络切片时,合同上定义了明确的服务内容。这就是SLA,在客户和服务提供商之间建立一套标准的服务规约,让双方能在一个频道进行问题的高效沟通。

SLA价值为何

随着5G切片+边缘云的不断融合发展,5G切片技术服务更多的垂直行业,才能获得更大的收益。据GSMA预测,中国未来五年的工业制造、交通物流等行业的市场规模超万亿,且60%的市场新增价值在政企客户,未来5G专网市场空间潜力巨大。

   

 典型的5G切片应用场景

在企业数字化转型过程中,5G专网业务将面临服务范围更广,客户需求多样,对5G专网运营带来了更高的挑战。通过定义5G切片SLA将对运营商运营带来以下的价值:

  • 明确责任:明确运营商和客户的各自责任范围,避免在出现问题时引起纠纷。例如对客户机房、客户终端发生故障而引起业务故障运营商可免责、故障处理时间也可进行相应的剔除。
  • 服务聚焦:售前中后服务更加聚焦,重点关注SLA指标执行情况,更快响应跟踪、处理问题。例如专享切片网络的20ms时延达成率是99%,那么大客户运维就盯紧上下行时延的日均值峰值。
  • 运营优化:在运营商管理成熟和业务量达到⼀定的规模时,还可以根据SLA指标的达成情况,及时调整运维策略降低成本。例如根据网络保障等级,X级以上业务才会在非法定工作日安排故障处理,以减少运维人员的加班成本支出。

SLA真身显现

参考业界成熟的ITIL标准,我们对网络服务的SLA进行如下定义。

服务目录

服务目录决定了服务范围,只有合同范围内的服务⽬录,服务商才会有后续的保障。服务目录要素包括服务测量指标SLI(service-level index)和服务等级目标SLO (service-level objective)。行业切片的常见SLI如开通时限、恢复时限、时延、可用率等。SLO描述了不同等级所提供功能的一种期望状态,如切片可用率对应普通级别为99.9%,对应高级别为99.95%。

服务日历

服务⽇历是合同中SLA约束的服务时间范围,即为客户提供X*X的服务响应期,是7*24还是5*8,是否扣除⼀个周期内的法定假期,在运维保障中是需要完全对应上的。

恢复时间

恢复时间是指当发⽣各种类型的会影响SLI测量值的事件时,运营商采取措施恢复服务的时间。其组成包括响应时间TTO(time to own )指从发现到指派处理所用的时间;解决时间TTR(time to resolve),指接单处理到服务完全恢复所用的时间。

恢复时间与SLO之间并不是一个简单的阈值控制,⽐如SLO定义了⼀年之中宕机时长<10个⼩时,但不能同一次故障里把10⼩时⽤完。恢复时间⾥定义了宕机属⼀级故障(解决时限1⼩时),这样会强制把10个⼩时分散到一年,以减少对业务的冲击。

SLA在垂直行业中

指标测量

SLA不仅要有目标,还要随时监控,这些都离不开指标的准确和及时测量。SLA指标包括服务类和网络类两种。

服务类主要是勘察、开通、故障、投诉等售前中后相关活动事件的有关响应时间、解决时间,这类SLI一般可通过对接OSS网管中台的编排/故障/运维中心获取到时间数据。

网络质量类指标测量的准确性、完整性、及时性,直接关乎SLA是否能准确履约和运营的效用。下面,我们就对切片网络指标的多种测量方案进行逐一介绍。

网络质量指标测量方案

  • OMC测量:通过OMC进行周期性的采集,可获取流量、时延、丢包等统计类指标。理论上可以获取到单用户级MR数据,但因为涉及用户位置等隐私数据,一般情况下大网是不开放的。对于归属用户专有基站,可在数据不出场的情况下进行测量获取。优点是现网基本具备,缺点就是时间粒度粗(15分钟)、切片/DNN级(一般无号卡用户级)、没有业务应用类指标测量能力。
  • 大数据测量:通过对用户每次网络交互报文进行抓取分析。报文包括N1和N4接口控制信令日志,以及N3接口的业务流DPI。优点是可提供用户业务操作级数据,可精准测量每次网络交互;缺点就是成本高,需专门的服务器硬件和网络分光器。特别对专享尊享切片,UPF园区内部署数据不出场的场景,N3接口业务流无法在运营商大网上获取到数据。
  • 终端测量:随着R16标准的冻结,网络和模组的测试能力也随之增强,例如QoS monitoring允许我们自主下发指定终端的上下行时延测试。特别是行业客户对终端有完全的自主权,可根据应用场景定制软探针,从客户角度对运营商的网络质量履约进行验证确认。优点是灵活可控、易于扩展,缺点就是高频测量可能会影响业务正常使用。

智能保障

对各垂直行业的SLA管理,不仅要考虑SLA指标的监控需求,还要考虑如何进行保障以确保业务的正常状态。行业切片应用中SLA指标专业性强、数据量大、测量复杂、可用性要求高。通过自动化的业务运维保障闭环,实现行业切片SLA的可靠守护。

在省级政企客户运维的项目中,我们建立通用的SLA指标质差规则模型,通过质差识别、质差治理和优化验证框架,完成SLA质差的智能保障。SLA智能保障处理过程参考如下:

对SLA指标进行分解得出网络层面可测量的原生指标,对这些原生指标建立自动采集和监控的预警机制。

通过多种原生指标的异动偏差组合分析,推导出业务质差场景,触发质差定界定位流程。

通过切片实例的网络资源树,找出切片的终端、无线、传输、承载、核心网、边缘云的网络实例,分别在各段各层网络查找问题,汇总并得到定界结论。

尝试对问题的自动修复,包括基站PRB比例增加、异常UE剔除出网、UDM和PCF上用户配置数据修正等。

需现场处理的情况,自动派单到运维管理系统,通知切片的运维负责人。

待上两步处理完后,继续对原生指标进行监控,以确认指标劣化偏离状态恢复正常。

上述只是基于规则分析的自动化SLA保障手段,随着AI智能的应用,SLA的智能化保障方案也在逐渐的丰富和成熟。通过导入海量的关联终端、基站、回传、核心网数据,通过机器学习推导出质量劣化模型,就可以在问题发生前进行预测,为各种保障工具的实施争取更多的时间,智能识别质量隐患点,并在质量问题发生前进行定点优化。

采矿行业实践

在21年某铜厂5G专网园区运维项目,我们对网络和业务的SLA指标(包含工业控制类指标)进行深入分析,实现了指标实时测量和汇总计算,同时结合数字孪生技术对无人工厂进行数字化还原和监控。

铜厂洗矿车间由于粉尘非常大,人员在现场操控非常不健康。为建成无人洗矿车间,需要4K高清视频监控,以及对皮带传送机和天车等机器进行远程控制。

  • 高清视频监控切片:主要传输洗矿车间监控的大视频类数据,使用4K类视频监控,上行带宽满足40Mbps即可;时延要求普通不高,约50ms;视频卡顿率和花屏率要求比较高,需小于0.1%。
  • 机器控制切片:主要进行天车和皮带运行的远程控制,传输内容主要以信令控制为主,对于上下行带宽要求不高,2Mbps即可;对于时延和丢包要求非常高,时延通常小于10ms,丢包率小于0.01%,PLC执行成功率大于99.9%。

车间层面和业务(天车)关键SLA指标监控

在本次采矿行业的SLA实践中,我们建立了一套完整的采矿行业SLA指标模型,包括集团-分公司-车间-天车(业务)的多层级SLA指标模型,关键指标数据包括5G网络类指标、工业控制类指标和设备实时运行类指标。

基于天车业务控制类指标和设备实时运行指标,我们还通过3D仿真建模,实时显示运行动态,让用户可实时了解设备运行情况。我们首先通过对设备尺寸等静态数据进行采集,再通过PLC上的各个方向上运动速度数据,还原出设备的实际位置位移数据,最终还原出设备的实际工作过程。

展望

5G 行业融合应用已经进入到关键探索期,5G切片SLA分级管理和保障是行业落地应用和规模推广的重要前提,我们将持续研究5G切片SLA的模型设计、高精测量、智能预测、智能保障等技术,实现5G技术的全行业应用百花齐放。

在未来不遥远的6G时代,控制面时延将达到 1ms,用户面时延将达到 0.1ms,流量密度将达到 0.1-10Gbps/m2,连接数密度将达到 0.1-1 亿设备/km3。业务场景包括沉浸式交互、云XR、全息通信、通感互联、智慧交互、数字孪生,空天地海一体化通信系统,全球无缝立体覆盖,用户随时随地接入。场景的丰富和指标需求的提升,需要更清晰可信的SLA提供保障。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值