网优笔记-5G常见终端问题排查方法
技术文档
问题名称: 常见终端问题(接入异常、切换异常、流量不达标)排查方法
现象概述: 实际测试中经常遇到终端接入异常、切换过程异常、流量不理想等问题,往往需要耗费精力定位,本方案通过总结常见故障,归纳出各类问题的排查思路,便于运用到日常测试中。
一、终端接入异常问题排查
终端在测试过程中无法接入的情况,按照导致原因的不同大致又分为两类:第一类是小区状态异常引起,需要排查小区异常原因;第二类是小区状态正常却无法接入,需要排查其他因素。
1、小区状态异常:终端无法搜索到目标小区,针对该现象,总结排查框架如下:
经过上述初步排查,需要确认站点告警,实际测试过程常见的告警如下图所示:
以“心跳异常”为例:终端在某个站点附近无法接入,排查到小区退服状态后,查询网管告警,发现报错“网元断链”,原因显示“心跳异常”,随之而来的“基站处于初始化状态”告警原因为“看门狗复位”:
针对该现象,提取基站黑匣子,解码发现“out of memory”报错,进一步定位发现SN添加时pscell判决进入死循环,导致HUC容器内存耗尽,从而引起看门狗复位。
2、小区状态正常,终端无法接入:此类问题,又区分SA站点接入异常和NSA接入异常两套排查框架:
1)SA站点接入异常
案例一:核心网升级到F60后,实验楼站点无法接入,信令流程出现“pdu session establishment reject”报错,经查由于升级过程没有更新TAC列表,导致核心网与基站TAC不一致,从而无法接入。
案例二:高通SA芯片测试,由于终端不支持SDAP,需要通过基站敲桩规避;
案例三:CCE资源配置错误导致UE无法接入,当CCE个数与候选集不对应时出现;
案例四:华师实验楼站点无法接入,终端侧信令发现,测量报告总上报同PCI不同站点小区信息,经确认,发现附近新开站点“华师图书馆”配置了与目标小区相同PCI,从而对目标站点产生干扰,重新规划PCI后,问题得到解决。
2)NSA站点接入异常排查思路如下图:
二、切换异常问题排查
案例一:干扰导致——A小区223到B小区340和77切换过程不上报MR;经查,B站点基带板上既有4.9G小区又有2.6G小区,为避开现网D频段对2.6G小区的干扰,通常做了帧头调整,该调整会针对基带板整体进行,然而实验楼的基带板只有4.9G小区没有调整动作,导致B站点的4.9G小区与A站点4.9G小区帧头没对齐,从而互相干扰导致切换失败;
案例二:Xn异常导致——A站点到B站点切换失败,发现Xn耦联故障,在Xnm容器“showAssoinfo”发现网管配置的Xnap状态异常,定位发现,由于邻区超过300条导致容器响应超时,控制邻区数量后解决;
案例三:切换过程出现“scg failure”原因“rlc-maxNumRetx”,该问题大多由于实际配置的rlc重传次数不够大超出范围,需要在网管调整最大重传次数解决;
案例四:宏站和微站切换失败,报错“scgfailure”原因“synreconfigfailure”,经查,由于微站不支持5slot的SRS周期配置,导致无法切换;
案例五:A站点到B站点切换过程中,切换完成后流量掉0,在目标小区重新接入后流量正常,经查,由于源侧与目标侧CSI测量配置不一致,导致切换过程UE携带源侧配置进入目标小区后测量信息无更新,触发流量掉0。
三、流量不达标问题排查
此类问题的原因众多,需要系统性考虑核心网、传输、基站等各环节联合定位,定位框架总结如下图:
在外场实际测试中,首先通过以上方法确认核心网和传输无限制后,按照以下分类情况筛查基站侧故障点:
以上列出问题为现场测试遇到过的故障汇总,即便遇到新问题,排查框架及基本方法途径类似。
经过整理上述各类故障,对现场常见问题形成可借鉴经验,推广给相关后台分析人员,加快现场问题在初期的排查效率,帮助现场快速缩小故障范围。
该方案梳理具有普适性,适用于同框架版本的各外场测试。
0条评论