摘要
在LTE网络中,重建是终端恢复RRC连接的一种行为。基站正常运行状态下,重建发生概率较低;如重建比例突然上升,本身就是异常表现。过高的RRC连接重建比例会影响用户感知,引起投诉。
针对区域内RRC连接重建比例高进行优化,本案例主要针对区域内 TOP小区RRC连接重建比高小区进行优化,以故障处理、参数优化、定时器调整、重叠覆盖,干扰排查,切换调整为优化手段,以达到降低RRC连接重建比例目的。
【关键字】RRC重建立 切换失败
1.1 重建概述
RRC重建(RRC connection re-establishment)是UE处于RRC_CONNECTED状态,因为一些移动性管理或底层链路故障,导致连接中断,UE发起的空口资源重新建立的过程,以继续空口的RRC连接。重建是UE在连接状态下,空口异常时重新恢复空口的过程。重建成功的前提是收到重建请求的小区有UE的上下文。重建的意义在于快速恢复空口业务,提高业务的连续性。
重建成功流程:
1.2 RRC重建请求消息
1.3 RRC重建命令消息
RRC重建完成消息:
如果目标小区无该UE的上下文信息,此时UE的RRC重建请求可能会被拒绝
重建失败流程:
2.重建原因
2.1 重建条件
UE在检测下行失步、切换失败、RLC重传达到最大次数等原因条件下,会在新的小区发起RRC重建过程,以试图快速重建业务,提升用户感受。LTE协议规定,网络侧只能对存在上下文的连接接受重建请求,没有上下文ID的请求将被拒绝而掉话。当UE从基站A重建至基站B时,这种重建必然因获取不到上下文而失败。在现网中,无上下重建失败在重建失败总次数占绝大多数。严重影响了客户感受。
上下文一般是eNodeB侧存储的UE的一些重要信息,包括UE能力、多承载信息(承载ID,QCI等级)、S1AP_ID、UE的安全性算法等。对于没有UE上下文的重建,目标基站必须通过某种手段获取源站的上下文,协议规定源站可以通过切换请求把UE的上下文带到目标站,因此获取上下文的载体是有了,但是如何通知源站把上下文通过切换请求带到目标站,协议中没有规定。因此只能通过私有消息方式通知源站,若私有消息走S1口,需要进核心网,核心网侧也需要识别该消息,处理上比较复杂,所以一般情况下会直接经过X2口处理该私有消息。目标基站收到RRC重建请求后,发现没有该UE的上下文,所以通过X2口发送一个私有消息给源侧基站请求源侧基站发送上下文,收到回复后,就按照正常的流程,继续完成RRC重建过程。
2.2 重建原因
协议上规定,引发UE发起重建流程的原因主要有以下几点:
- 上层检测到底层通知的无线链路失败:
UE检测到当前检测到“radio link failure”,则会发起原因值为“other”的中间,通常引起RLF存在如下三种机制:
- 上行RLC重传达到最大次数
“indication from RLC that the maximum number of retransmissions has been reached”,包括SRB和DRB,与eNB侧下行的SRB与DRB机制相同,当UE RLC发送了一个PDU之后,需要等到eNB侧反馈对应的状态PDU才能完成一次RLC的正常调度。对于没有收到eNB状态PDU的原因有两个,一个原因为eNB侧上行根本就没有收到任何RLC PDU,也就不会响应状态PDU,另一个原因为eNB响应的状态PDU,由于下行误码的原因,没有到达UE侧。
- MAC层SRI重传达到最大次数
在切换过程中,切换完成命令丢失后导致的PUCCH没激活,或者,在业务保持过程中由于Ta超时导致的PUCCH没激活,此时如果UE有SR发送,因为下行链路问题,UE无法收到ENB的MAC层确认,SR重传达到最大次数后触发MAC_RA_IND,上报给L3后发起重建请求。
- UE检测到下行RLF
UE DSP每200ms对时延谱滤波值进行判断,如果满足某门限,则上报L3失步;L3在同步状态连续收到N310次L1上报的失步指示,则认为失步;同时,启动T310定时器,超时前,若收到N311次同步指示,则认为UE恢复同步状态,否则,T310超时后触发重建(包括搜索小区、同步、重建),启动T311定时器,若超时仍未重建成功,则进去IDLE态。
- 切换失败,重建到原小区;
UE在切换流程中,在收到了切换的重配置消息之后,会启动T304,但如果在T304超时之前UE无法完成在目标小区的随机接入,则会发起原因值为“handover failure”的重建
- 系统内或IRAT的移动性过程失败,如切换时T304超时、目标小区建立RRC连接失败、UE不适配MobilityFromEUTRACommand的配置等
- 底层完整性检查失败
UE无法配置RRC重配消息中的部分配置, 重配失败;
UE在安全模式激活的状态下,如果收到了重配置消息后对于重配置消息内的信元无法匹配/兼容,则发起原因值为“reconfiguration failure”的重建。
3.案例分析
3.1 问题描述
SZL8ZMC张家港_沙钢石灰厂NB_18从9月24日开始重建指标开始恶化,日均重建次数由3500次左右增加至13000次左右,重建比由8.6%增加到27.06%左右。
在网管上查询该小区RRC重建原因值如下:
从话统看重建原因主要为切换失败触发和其它原因触发而导致RRC重建立请求次数增加,导致小区的RRC重建比高。
3.2 问题分析
网管提取SZL8ZMC张家港_沙钢石灰厂NB_18小区级切换指标,发现29日起切换出请求次数与切换执行阶段失败次数均呈现几何数的增长,如下图。
网管提取SZL8ZMC张家港_沙钢石灰厂NB_18提取邻接关系切换对指标,发现该小区自29日起与该站同方向SZL2ZMC张家港_沙钢石灰厂_50小区存在大量的切换执行阶段失败次数。
查看SZL2ZMC张家港_沙钢石灰厂_50发现自29日起该小区用户无法正常接入,业务量趋于0,如下表:
SZL2ZMC张家港_沙钢石灰厂_50业务量趋势图
从图可知,知29日期该小区RRC连接最大用户数为0,小区有激活态用户,但业务量趋于0,疑由于该小区无法正常接入,导致SZL8ZMC张家港_沙钢石灰厂NB_18与该小区切换失败而重建,导致SZL8ZMC张家港_沙钢石灰厂NB_18重建比高。
3.3 解决措施
经核现网配置数据该站点SZLAZMC张家港_沙钢石灰厂(272236)近期无配置数据修改,站点当前无告警,查看历史告警,站点有软件运行异常告警。
疑站点隐形故障引起用户无法接入,远程单板复位,小区依然无用户接入,怀疑板卡故障,通知维护更换板卡后,小区恢复正常。
更换板卡后SZL8ZMC张家港_沙钢石灰厂NB_18RRC重建请求次数和重建比例指标恢复正常,如下图:
4.总结评估
RRC连接重建原因有RRC重配失败、切换失败以及其他原因;其中因本站切换失败或者top小区周边站点切换失败导致重建比较常见,处理RRC重建比例高小区优先从切换关系着手,找出切换关系top小区,排查是否因目标小区异常引起源RRC重建比高。减少RRC重建请求次数,降低RRC重建比例,提升用户感知。