无线网络优化常见故障——无线用户体验差

目录

无线用户体验差

i. 用户反馈无线一直掉线

1、故障现象

2、网络环境

3、故障原因

4、处理步骤

5、故障解决

ii. 无线用户异常掉线、不稳定

1、故障现象

2、故障可能原因

3、故障处理流程

4、故障处理步骤

步骤1:确认终端是否关闭保活页面(适用于Web一代认证)

步骤2:排查无线用户的信号强度

步骤3:排查是否存在流氓AP 启用了反制功能

步骤4:排查是否存在无线同频干扰

步骤5:确认是否存在ARP攻击

步骤6:排查个体无线网卡问题

步骤7:排查AC/AP版本是否为最新版本

步骤8:收集信息后,请联系4008111000协助处理

iii. 无线用户上网慢、网络很卡

1、故障现象

2、故障可能原因

3、故障处理流程

 4、故障处理步骤

步骤1:确认有线网络是否正常

步骤2:排查无线用户信号强度

步骤3:确认无线用户关联速率

步骤4:排查是否有环境干扰

步骤5:排查是否存在流氓AP 启用了反制功能

步骤6:确认终端是否开启了无线扫描软件

步骤7:确认终端是否开启节电和漫游

步骤8:收集信息后,请联系4008111000协助处理



 

 

无线用户体验差

i. 用户反馈无线一直掉线

1、故障现象

用户反馈无线一直掉线

2、网络环境

简化:AP220-----POE交换机-------中间设备------5708k设备

3、故障原因

我司AC设备使用的是多核架构,其中一个核作为控制核,用来控制转发核转发数据;其他核作为报文的转发核,用来进行报文转发。控制核出现死机问题,设备整机会重启,转发核出现死机的话,这个转发核就不能够继续使用。

      现场AC设备开启了热备,热备需要主备AC定时发送保活报文,热备保活报文是通过AC上其中一个转发核进行发送的。现场出现问题的时候,经过定位,发现发送热备报文的一个转发核出现过死机现象。由于转发核死机导致热备保活报文无法发送,主备AC都认为对端出现问题,导致热备不停的断开重建,主备关系不停的改变,AP不停的和两台AC建立热备关系。同时由于短时间内Sta的关联数据无法及时同步完成,这样在热备断开又恢复的过程中,Sta的数据没法及时同步,导致出现Sta上线之后又下线的问题。

     转发核死机的问题,进过定位可以确定是由于控制核在删除Sta用户表项,但是转发核还在使用这个表项导致的。这个问题目前已经有解决方案。

4、处理步骤

(1)研发人员到财务现场,用测试PC一直出现STA掉线情况;

(2)在AP上查看log,发现VAP报文一直更新,用户掉线原因是code (8)

2014-11-26  16:15:12 |00:00:19:04: %WLAN-6-OUTPUT: STA(40f0.2f7e.784b) actives in BSSID(0a1b.b120.a4bf): Reasso succeed.

2014-11-26  16:15:12 |00:00:19:05: %WLAN-6-80211N: STA(40f0.2f7e.784b) is forced to leave BSSID(001b.b120.a4bf): Disassoc by AP, reason code(8).

2014-11-26  16:15:13 |00:00:19:06: %WLAN-6-80211N: STA(c83a.35cf.38f1) is forced to leave BSSID(061b.b120.a0dd): The STA information is invalid, disassoc station, reason code(8).

(3)如上log显示code(8)一般为AC主动踢STA下线

(4)问题怀疑点非AP单点问题

(5)登录到AC上查看,打开log发现AC热备保护报文一直fail,热备状态异常

2014-11-26  16:14:50 |ruijieAC-Back#show wlan hot-backup 1.1.1.1

2014-11-26  16:14:50 |wlan hot-backup 1.1.1.1

2014-11-26  16:14:50 |  hot-backup     : Enable

2014-11-26  16:14:50 |  connect state  : HDSK------------热备状态异常,正常情况是CHANNEL_UP

2014-11-26  16:14:50 |  hello-interval : 1000

2014-11-26  16:14:50 |  kplv-pkt       : ip

2014-11-26  16:14:50 |  work-mode      : NORMAL

2014-11-26  16:14:50 |  !

2014-11-26  16:14:50 |  context 10

2014-11-26  16:14:50 |    hot-backup role        : SINGLE-ACTIVE  

2014-11-26  16:14:50 |    hot-backup rdnd state  : PAIR-IDLE

2014-11-26  16:14:51 |    hot-backup priority    : 4

2014-11-26  16:14:51 |    ap-group               : Baijingge

2014-11-26  16:14:51 |    ap-group               : Chuangxinxueyuan

2014-11-26  16:14:51 |    ap-group               : Dong1she

2014-11-26  16:14:51 |    ap-group               : Dong5lou

2014-11-26  16:14:51 |    ap-group               : Dong6she

2014-11-26  16:14:51 |    ap-group               : Dong7she

2014-11-26  16:14:51 |    ap-group               : Dong9lou

2014-11-26  16:14:51 |    ap-group               : Guanggu

2014-11-26  16:14:51 |    ap-group               : N6lou

2014-11-26  16:14:51 |    ap-group               : Qimingxueyuan

2014-11-26  16:14:51 |    ap-group               : Tiyuguan

2014-11-26  16:14:51 |    ap-group               : Xi12she

2014-11-26  16:14:51 |    ap-group               : Xi13she

2014-11-26  16:14:51 |    ap-group               : Xi6she

2014-11-26  16:14:51 |    ap-group               : Xi8she

2014-11-26  16:14:51 |    ap-group               : Xi9she

2014-11-26  16:14:51 |    ap-group               : Zhaodaisuo

2014-11-26  16:14:51 |    vrrp interface - group : VLAN 2 - 2

2014-11-26  16:15:02 |ruijieAC-Back#ex

2014-11-26  16:15:02 |

2014-11-26  16:15:02 |ruijieAC-Back VTY0 is now available

2014-11-26  16:15:02 |

2014-11-26  16:15:02 |ruijieAC#

2014-11-26  16:15:02 |ruijieAC#

2014-11-26  16:15:06 |ruijieAC#show wlan hot-backup 2.2.2.2

2014-11-26  16:15:06 |wlan hot-backup 2.2.2.2

2014-11-26  16:15:06 |  hot-backup     : Enable

2014-11-26  16:15:06 |  connect state  : CHANNEL_UP

2014-11-26  16:15:06 |  hello-interval : 1000

2014-11-26  16:15:06 |  kplv-pkt       : ip

2014-11-26  16:15:06 |  work-mode      : NORMAL

2014-11-26  16:15:06 |  !

2014-11-26  16:15:06 |  context 10

2014-11-26  16:15:06 |    hot-backup role        : PAIR-ACTIVE

2014-11-26  16:15:06 |    hot-backup rdnd state  : REALTIME-SYN-------说明热备之间在同步信息,热备状态是不稳定的

2014-11-26  16:15:06 |    hot-backup priority    : 7

2014-11-26  16:15:06 |    ap-group               : Baijingge

2014-11-26  16:15:06 |    ap-group               : Chuangxinxueyuan

2014-11-26  16:15:06 |    ap-group               : Dong1she

2014-11-26  16:15:06 |    ap-group               : Dong5lou

2014-11-26  16:15:06 |    ap-group               : Dong6she

2014-11-26  16:15:07 |    ap-group               : Dong7she

2014-11-26  16:15:07 |    ap-group               : Dong9lou

2014-11-26  16:15:07 |    ap-group               : Guanggu

2014-11-26  16:15:07 |    ap-group               : N6lou

2014-11-26  16:15:07 |    ap-group               : Qimingxueyuan

2014-11-26  16:15:07 |    ap-group               : Tiyuguan

2014-11-26  16:15:07 |    ap-group               : Xi12she

2014-11-26  16:15:07 |    ap-group               : Xi13she

2014-11-26  16:15:07 |    ap-group               : Xi6she

2014-11-26  16:15:07 |    ap-group               : Xi8she

2014-11-26  16:15:07 |    ap-group               : Xi9she

2014-11-26  16:15:07 |    ap-group               : Zhaodaisuo

2014-11-26  16:15:07 |    vrrp interface - group : VLAN 2 - 2

              (6)如上热备震荡,可判断用户掉线导致原因由AC设备触发       

              (7)在AC debug su下 查看,发现AC四个核死机

                     debug su

                      show ex

5、故障解决

内部重现及验证:

研发内部经过放大问题出现的条件,可以重现出转发核死机的问题。使用解决的版本验证,问题得到解决。

解决方案:

通过升级版本解决转发核死机的问题。

这个问题只在10.x版本存在。由于11.x底层采用LINUX平台,分为用户空间和内核空间,转发属于内核空间,当转发核死机之后,会整机重启,同时:

1、在aclk中,删除ace使用了延迟删除ace操作,保证转发核不再使用该ace后,再删除

2、在添加ace中使用了内核内存屏障,保证插入ace的一致性。删除使用时用list_del_rcu,确保删除时,没有ace在使用。

  故11.x不会存在10.x这个转发核死机,但是AC设备还在运行的情况。  

ii. 无线用户异常掉线、不稳定

1、故障现象

无线用户在使用无线网络过程中,出现异常掉线,通信不稳定。 

2、故障可能原因

1)关闭保活页面

2)无线信号弱

3)流氓AP 启用了反制功能

4)无线同频干扰严重

5)无线网络存在ARP攻击

6)无线网卡问题

7)版本不稳定 

3、故障处理流程

4、故障处理步骤

步骤1:确认终端是否关闭保活页面(适用于Web一代认证)

确认AC是否使用了Web一代认证。目前大部分手机终端不支持多进程,在访问其他网页的时候保活页面将自动关闭,出现这种情况的时候可以关闭eportal服务器的页码保活功能或者将Web一代认证更改为Web二代认证。

eportal关闭流量保活操作:

如果关闭了eportal流量保活功能问题仍不能解决,则进入下一步排查。

步骤2:排查无线用户的信号强度

在AP上show dot11 associations all-client查看RSSI,如果小于等于20,则AP收到sta信号已经低于默认阀值,可以通过调低rssi阀值改善用户接入的稳定性,若修改了rssi后用户接入无线稳定,则问题定位为无线用户信号强度太弱,此问题的根本原因是信号覆盖过弱,如果要彻底解决的话需要增强信号覆盖,比如新增AP、把全向天线更换为定向天线、更换AP的位置让AP更靠近STA、将放装型部署更改为智分部署;也可以采用调整RSSI的方式临时解决,若修改RSSI后仍接入不稳定,则进入下一步骤排查。

WS5708(config)#ap-config AP620H

WS5708(config-ap)#response-rssi 10 radio 1 //将RSSI调整为10(-95+10=-85dB),即STA 为-85dB的信号强度也可以允许接入。

步骤3:排查是否存在流氓AP 启用了反制功能

如果AP收到STA信号很好,STA无线连接仍异常断开,并在AP上看到STA还是在线的状态,则被流氓AP反制的可能性很大(除客户方合法AP外,其他的AP我们都认为是流氓AP,比如学生私自架设的D-Link或TP-Link无线AP)。如果有无线抓包网卡(Cisco Linksys AE1000 )也可以进行无线抓包,发起反制的AP通常会广播出大量解关联或者解认证报文如下图所示。

这些流氓AP将导致无线射频环境不可控,需要和客户协商将流氓AP关闭,若关闭流氓AP后无线连接稳定,则问题定位为流氓AP的反制功能影响了用户使用,此时可以把流氓AP关闭,或是关闭反制功能,若关闭流氓AP后仍不稳定,则进入下一步骤排查。

解认证

解关联

步骤4:排查是否存在无线同频干扰

使用WirelessMon等无线扫描软件扫描当前射频环境,排查是否存在同频干扰(多个ap的信道同时是1或是6或11,并且信号高于-75dB),若存在同频干扰,则调整当前无线的工作信道使其工作在非同频信道。该命令示例如下,如下为调整radio 1的信道至信道1,若调整信道后无线接入稳定,则问题定位为无线同频干扰,通过合理划分信道从而避免同频干扰,若调整后仍不稳定,则进入下一步骤排查。

AC(config)#ap-config 001a.a9bf.ffdc

You are going to config AP(001a.a9bf.ffdc), which is not on line now.

AC(config-ap)#channel 6 radio 1

(取值范围1、6、11;如果2.4G需要信道不重叠,可以尝试三个参数达到最优效果) 

1信道同频干扰严重

步骤5:确认是否存在ARP攻击

登到网关设备确认网关的MAC地址,出现掉线的时候在PC DOS界面下输入“arp -a”确认网关MAC地址是否已经变更。如果被改变则网络里存在了ARP攻击,可以通过在DOC上静态绑定网关MAC地址“arp -s 192.168.33.1 xx-xx-xx-xx-xx-xx”或者在网络里部署防ARP攻击(参考配置《锐捷工程师常见问题一本通》->"无线自研产品线"->“无线环境”->“常见咨询”->“3、如何防护无线的ARP攻击”)。如果网络没有APR攻击但是仍然出现掉线,则进入下一步排查。

网关在交换机的确认方式:

SW#show interfaces vlan 10

Index(dec):4106 (hex):100a

VLAN 10 is UP  , line protocol is UP   

Hardware is  VLAN, address is 0000.5e00.0185 (bia 0000.5e00.0185) //确认网关MAC地址

Interface address is: 192.168.33.1/24

ARP type: ARPA, ARP Timeout: 3600 seconds

  MTU 1500 bytes, BW 1000000 Kbit

步骤6:排查个体无线网卡问题

若以上排查方法均无效,则考虑是否是个体无线网卡的问题,此时采用替换法,一是更换笔记本进行测试,二是把无线网卡驱动升级到官方最新版进行测试,最新无线网卡驱动可以在无线网卡官方网站下载或是用驱动精灵等驱动下载软件,若更换笔记本或是升级驱动后问题解决,则此问题定位为个体无线网卡的问题,后续通过升级网卡驱动进行解决,若更换笔记本后更新驱动后仍无法解决,则进入下一步骤排查。

步骤7:排查AC/AP版本是否为最新版本

登陆产品管理系统:http://rtrcn.ruijie.com.cn/,查看最新版的AC/AP版本发行说明里是否有解决此类问题,若有解决此类问题,则尝试升级至最新版本进行观察和测试,升级后问题解决,则此问题定位为软件版本问题,若仍无法解决,则进入下一步排查。

步骤8:收集信息后,请联系4008111000协助处理

拨打4008111000寻求技术支持,收集如下故障信息,进行故障进一步处理:

·    需要收集的信息:

1)在AC上收集如下信息:

show version

show version all

show running

show ap-config run

show ap-config sum

show logging

2)在AP上收集如下信息:

show dot11 associations all-client

show dot11 wireless 1/0

show dot11 wireless 2/0

show interface

show logging

3)无线终端的操作系统:比如window xp、window 7、安卓、黑莓、iphone

4)无线网卡型号和驱动版本号:比如Intel(R) Centrino(R) Advanced-N 6200 AGN   驱动版本号:14.2.0.10

5)现场射频环境截图:用WirelessMon等信号扫描软件扫描到的射频环境截图、信道分布、场强大小

6)AP部署点位图

·    需要收集的信息解释:

AC

show version:AC版本信息

show version all:AP版本信息

show running:AC配置信息

show ap-config run:AP配置信息

show ap-config sum:AP状态

show logging:AC日志信息

AP

show dot11 associations all-client :无线用户状态信息

show dot11 wireless 1/0 :查看射频卡1信息

show dot11 wireless 2/0 :查看射频卡2信息

show interface :查看物理接口及射频卡流量

show logging:AP日志信息 

iii. 无线用户上网慢、网络很卡

1、故障现象

无线用户在上网过程中速度很慢、网络很卡 

2、故障可能原因

1)有线网络延时大

2)无线用户信号弱

3)无线用户低速关联

4)环境干扰

5)流氓AP启用了反制功能

6)测试时开启无线软件

7)终端频繁节电及漫游

3、故障处理流程

 4、故障处理步骤

步骤1:确认有线网络是否正常

在AC上Ping AP及无线用户网关,确认延时是否正常。如果有线网延时不正常则需要排查有线网络的问题。如果有线网延时正常但是无线终端ping网关延时很大则进入下一步排查。

步骤2:排查无线用户信号强度

在AP上show dot11 associations all-client查看RSSI,确认RSSI是否在30以上。在电脑上使用wirelessmom 查看AP信号强度是否在-65以上。如果信号低于阀值则需要通过增强信号覆盖解决这个问题,比如新增AP、把全向天线更换为定向天线、更换AP的位置让AP更靠近STA、将放装型部署更改为智分部署。如果信号很好,网络还是很慢,则进入下一步排查。

Ruijie>show dot11 associations all-client 

INTF-IDX ADDR              AID  CHAN  RATE  RSSI_RT IDLE TXSEQ  RXSEQ  ERP  STATE  CAPS HTCAPS TYPE ASSOC_TIME GTOSS RSSI_AVG RSSI_RECORD

       6             08:11:96:92:24:4c 1    6       1.0M  46        1       13        2000    0x0   0x3     ESs                 N      00:00:19        0          46            40  

步骤3:确认无线用户关联速率

在AP上"show dot11 associations all-client"找到用户MAC确认关联速率是否为低速,如果用户信号覆盖很好但是低速关联则建议可以进行无线优化"关闭低速率集"。

Ruijie>show dot11 associations all-client 

INTF-IDX ADDR              AID  CHAN  RATE  RSSI_RT IDLE TXSEQ  RXSEQ  ERP  STATE  CAPS HTCAPS TYPE ASSOC_TIME GTOSS RSSI_AVG RSSI_RECORD

6        08:11:96:92:24:4c 1    6     1.0M  46      1    13     2000   0x0  0x3    ESs         N     00:00:19 0       46       40  

关闭低速率配置:

ac-controller

 802.11g network rate 1 disable

 802.11g network rate 2 disable

 802.11g network rate 5 disable

 802.11b network rate 1 disable

 802.11b network rate 2 disable

 802.11b network rate 5 disable

如果用户没有低速关联仍然很卡则进入下一步排查。

步骤4:排查是否有环境干扰

使用WirelessMon等无线扫描软件扫描当前射频环境,排查是否存在同频干扰(多个ap的信道同时是1或是6或11,并且信号高于-75dB),若存在同频干扰,则调整当前无线的工作信道使其工作在非同频信道。该命令示例如下,如下为调整radio 1的信道至信道1,若调整信道后无线接入稳定,则问题定位为无线同频干扰,通过合理划分信道从而避免同频干扰,若调整后仍不稳定,则进入下一步骤排查。

WS5708(config)#ap-config AP220-E

WS5708(config-ap)#channel 1 radio 1

(取值范围1、6、11;如果2.4G需要信道不重叠,可以尝试三个参数达到最优效果) 

1信道同频干扰严重

步骤5:排查是否存在流氓AP 启用了反制功能

如果AP收到STA信号很好,STA无线连接仍异常断开,并在AP上看到STA还是在线的状态,则被流氓AP反制的可能性很大(除客户方合法AP外,其他的AP我们都认为是流氓AP,比如学生私自架设的D-Link或TP-Link无线AP)。如果有无线抓包网卡(Cisco Linksys AE1000 )也可以进行无线抓包,发起反制的AP通常会广播出大量解关联或者解认证报文如下图所示。

这些流氓AP将导致无线射频环境不可控,需要和客户协商将流氓AP关闭,若关闭流氓AP后无线连接稳定,则问题定位为流氓AP的反制功能影响了用户使用,此时可以把流氓AP关闭,或是关闭反制功能,若关闭流氓AP后仍不稳定,则进入下一步骤排查。 

解认证

解关联

步骤6:确认终端是否开启了无线扫描软件

在终端上确认是否有开启wirelessmom、inSSIDer、第三方无线扫描软件,这些软件将占用无线网卡很多资源,极有可能导致可能终端上网慢,如果有这些软件请将这些软件关闭或卸载。如果没有类似的软件但是仍然Ping 延时很大,则进入下一步排查。

步骤7:确认终端是否开启节电和漫游

无线终端开启节电功能后不定期会关闭无线网卡,这个期间无线网卡不接收任何数据,这时候AP将要发送到终端的数据进行缓存,当终端苏醒后AP会进行帧聚合以大包发送给终端,这样将导致数据延时及丢包率变大。

无线终端频繁在AP之间漫游有线二层需要频繁收敛,将导致用户丢包率变大。

在终端上确认无线网卡是否有开启了节电功能和漫游主动性调整为最高,这两个功能很大程度影响了用户体验,建议关闭节电和调低漫游主动性,由于不同网卡设置稍有不同,如下只举一个事例。如果调整了节电和漫游,用户上网仍然很卡,则进入下一步排查。 

禁用无线网卡节电模式,“将允许计算机关闭此设备以节约电源”勾选去掉:

将漫游主动性调为最低:

步骤8:收集信息后,请联系4008111000协助处理

拨打4008111000寻求技术支持,收集如下故障信息,进行故障进一步处理。

·    需要收集的信息:

1)在AC上收集如下信息:

show version

show version all

show running

show ap-config run

show ap-config sum

show cpu

show memory

show log

2)在AP上收集如下信息:

show dot11 associations all-client

show dot11 wireless 1/0

show dot11 wireless 2/0

show interface

show cpu

show memory

show log

show run

3)无线终端的操作系统:比如window xp、window 7、安卓、黑莓、iphone

4)无线网卡型号和驱动版本号:比如Intel(R) Centrino(R) Advanced-N 6200 AGN   驱动版本号:14.2.0.10

5)现场射频环境截图:用WirelessMon等信号扫描软件扫描到的射频环境截图、信道分布、场强大小 

·    需要收集的信息解释:

AC

show version:AC版本信息

show version all:AP版本信息

show running:AC配置信息

show ap-config run:AP配置信息

show ap-config sum:AP状态

show cpu :查看AC CPU利用率

show memory :查看AC 内存利用率

AP

show dot11 associations all-client :无线用户状态信息

show dot11 wireless 1/0 :查看射频卡1信息

show dot11 wireless 2/0 :查看射频卡2信息

show interface :查看物理接口及射频卡流量

show cpu :查看AP CPU利用率

show memory :查看AP 内存利用率

  • 20
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

你可知这世上再难遇我

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值