目录
AC常见故障
结构类问题
设备晃动有异响
- 确定设备异响部位,并在设备返修单的返回信息栏中备注发现该现象的细节。
- 检查设备外壳有没有碰撞痕迹,有没有明显变形部位。
- 将设备返修,注意返回设备的包装使用标准包装,以免设备遭受二次损伤。
以太网端口网线插不紧
- 通过更换水晶头,交叉验证观察是否属于水晶头非标原因,如发现为非标水晶头,建议客户更换至标准的水晶头或使用成品网线进行验证。
- 如通过更换水晶头仍不能解决脱落问题,将此批水晶头在其它设备上进行试插,观察是否易脱落,以此判断设备的连接器有没有问题。
如确认通过更换水晶头仍不能解决,并判断和设备的连接器有关,联系汉明技术支持工程师协助处理。
整机电源类问题
电源模块故障
电源模块故障的常用定位方法如下:
- 测量输入电压,有条件时,使用万用表测量输入电压,根据电源模块的工作电压范围判断输入电压是否异常。
- 插拔电源模块,把电源模块,以及电源线进行重新插拔,排除接触不良的因素。
- 交叉验证电源模块,将有故障的电源放到其他正常的设备中观察,或从其他设备中拿正常的电源来交叉验证,判别故障。若交叉验证之后,故障跟随电源模块,则将该电源模块返修。
- 若交叉验证之后仍在该设备出现电源异常,联系汉明技术支持工程师协助处理。
无法启动类问题
AC可以上电,但无法正常启动,且串口没有打印信息
- 判断电源模块是否OK,可以通过交叉验证的方式,参照整机电源类问题。
- 查看设备外观有没有明显的端口发黄变色痕迹,如有明显的水晶头发黄变色痕迹,一般属于雷击或者浪涌造成的故障,可能是内部CPU芯片被击坏失效,建议与4006062029取得联系,填写设备返修单返修。
- 如外观看不出明显的痕迹,建议联系汉明技术支持工程师协助处理。
AC可以上电,串口可以打印信息,但无法正常启动
- 如串口可以打印信息,建议在启动过程中,按CTRL+B进入Bootrom菜单,按CTRL+E进行检测菜单,对Sdram、FLASH等进行测试,判定硬件器件是否有故障,若检测明确硬件器件故障,建议与4006062029取得联系,填写返修单返修。
- 如检测器件没有问题,建议联系400汉明技术工程师判断是否需要进行软件升级或者其他配置。
- 若仍不能恢复,建议联系汉明技术支持工程师协助处理。
端口类问题
电口不能UP
- 100M/1000M电口设备,如果跟对端设备连接后,首先将端口设置成自协商。
- 若设置成自协商还是不能link up,则请查看对端设备是否也是设置成自协商方式。
- 个别厂家设备跟汉明无线控制器设备互连可能自协商不能link up,这时请将两端端口都尝试设置成强制方式
- 若设置成强制方式还是不能link up,则请用网线在汉明科技无线控制器设备上环回测试,将控制器上两个端口用一根网线环接,若能link up,则可以确定设备没有问题,问题可能出在对方设备上,请联系对端设备厂家协助解决。
- 若还是不能link up,请先排除网线原因并更换端口测试,若仍然不能UP,请联系汉明技术支持工程师协助解决。
光口不能UP问题
- 光口接口板,如果跟对端设备连接后,首先将端口设置成自协商。
- 若设置成自协商还是不能link up,则请查看对端设备是否也是设置成自协商方式。
- 个别厂家的设备跟汉明科技无线控制器设备互连可能自协商不能link up,这时请将两端端口都尝试设置成强制方式。
- 设置成强制方式还是不能link up,则请用光纤直接在汉明科技无线控制器设备上环回测试,将控制器上两个光口用一对光纤环接。若能link up,则可以确定设备没有问题,问题可能出在对方设备上或者光链路上。
- 若仍不能link up,请使用光功率器测量对接双方的光功率是否满足光接收灵敏度范围,可以通过在各自的接收端测试光功率来确定。并检查光跳线接头清洁度情况,必要时可以通过更换光跳线进行验证。
- 检查互连两端设备的光模块型号及模式,确认所采用的是单模还是多模光模块,需配合使用相对应的模式光跳线。
- 若以上排查步骤皆不能使端口UP,建议更换光模块,若仍不能解决问题,建议更换设备,将故障设备返修。
现场常见问题
用户接入信号差
用户反馈的信号差,需要进行详细了解现象。一般情况下,用户说的信号差包括两大类:信号强度弱和信号质量差。
信号强度较弱导致STA不能正常上线或者不能正常上网,一般是因为AP功率过低或终端网卡灵敏度过低引起,需要调整AP功率或调整AP覆盖位置。
信号质量差一般是指无线环境中的干扰严重,导致终端连接时关联困难、终端反复下线、终端网速较慢转发困难(ping测试时出现丢包或延时过大)等现象。
通常我们采用如下手段进行问题定位和排查:
- 测试信号强度
- 通过终端初步判断
- 常用扫描工具
- 干扰检测
- 干扰处理
测试信号强度
信号差最常见的是指信号强度弱,可以用软件扫描周围无线网络的信号强度。以inSSider为例,扫描无线信号强度RSSI,一般区域要求信号强度大于-75dBm,如果信号强度很弱(例如小于-75dBm),需要调整AP功率,同时重新进行网络规划。
如上图inSSider扫描所示,信号强度RSSI弱的网络是质量比较差的网络,需要调整AP功率。如果是因为自动调优引起AP功率降低,那需要取消自动调优,采用固定模式,手动规划AP的信道和功率。
通过终端初步判断
信号质量差会严重影响终端用户的业务,一般用户反馈为:信号差、关联不上、自动下线、网速慢等。可按照反馈依次进行排查。
排查关联不上
根据终端上线处理步骤排查是否是因为终端网卡性能、AP功率过低等问题导致,终端问题可通过用其它终端替换的办法进行排查。AP功率过低可通过inSSider等扫描工具查看网络信号强度进行排查:
- 如果是终端问题,请更新网卡驱动,更换终端。
- 如果AP功率过低,可调整AP发射功率,使得信号扫描RSSI满足接入要求。
- 如果不是上述原因,进行下一步排查。
排查自动下线
排查终端网卡问题、AP功率问题,通过多台终端上网效果进行对比,定位是否是终端网卡的问题,如果多台终端中只有一台出现自动下线,可以定位为终端网卡个体问题,如果多台终端随机出现该问题,建议更换AP。
网速慢
上网速率慢,是用户体验的反馈,故障排查时可用ping进行量化测试,看是否出现时延大、概率性丢包等现象。若出现丢包率高(>3%),平均延时大(>500ms)的情况,则可能存在性能问题。
常用扫描工具
如果怀疑因无线环境差导致上述问题,可用信号扫描工具扫描周围无线环境,检查是否存在信道冲突导致的干扰。
常见的终端扫描工具有:WirelessMon、inSSider、Network Stumbler等,android 手机可使用手机WiFi分析仪。
手机WIFI分析仪
手机WiFi分析仪的信道扫描如下图所示。
WirelessMon
Inssider
干扰检测
如果用扫描工具不能判断是否有干扰,则可排查周围是否存在蓝牙、红外、微波炉等非WLAN无线设备。非WLAN设备对WLAN网络的干扰很大,可通过频谱仪进一步排查。
干扰可以分为两大类:
- AP同频干扰:两个工作在相同频段上的AP之间的相互干扰。例如,对于规模较大的WLAN网络,同一信道常常需要被不同AP使用。当这些AP之间存在着重复区域时,就存在同频干扰问题,大大降低网络性能。
- AP邻频干扰:两个中心频率不同的AP的发射频宽有重叠的部分,形成了邻频干扰。因此,邻频设备距离太近或信号太强时,会导致整体的噪声变高,影响网络性能。
- STA干扰:如果AP周围存在过多的非本AP管理的STA,可能会对本AP下的STA的业务造成干扰。
干扰处理
通过上述步骤检测出来干扰源后,可通过调整来改善无线环境质量。
Wi-Fi干扰
对于检测到的同频或临频干扰,可通过重新规划调整信道和功率来改善质量。如果无线环境中信道干扰较多,信道无法错开,只能通知客户将其它Wi-Fi设备进行位置调整。
非Wi-Fi干扰
非Wi-Fi干扰是指蓝牙、无绳电话等干扰,只能让客户协调,将设备的使用时间避开AP正常使用时段,或将设备移开。
用户上线
用户上线失败的常见原因
认证失败常见原因是域名与有效认证服务器没绑在一起,Radius服务器上没有配置设备的IP地址做AAA Client,Radius服务器与设备之间的sharekey不一致。对于Portal认证,还有可能Portal服务器上没有将客户端的IP地址加入到客户端认证表列中。
终端无法获取IP地址
通常采用给无线终端配置一个静态IP地址方法判断出终端上线失败是在获取IP地址阶段前出问题还是获取IP地址阶段出现问题。如果配置静态IP地址之后,用户能够稳定在线,则由于用户无法获取IP地址接入不了,否则是用户无法关联或者认证失败。
用户关联失败有如下几种常见原因:
- AC或AP上配置了黑白名单
- AP与终端的射频模式不匹配
- 达到AP或SSID限制的最大用户数
- 干扰严重,空口环境差
检查黑白名单列表
如果AP使能黑名单且终端在黑名单中,将该终端从黑名单中删除,或者关闭AP黑名单功能。重新尝试终端是否能关联上AP。
检查是否达到VAP或者AP最大用户数
查看VAP 支持最大用户数,可以在无线控制器的AP列表菜单中查询对应AP的当前用户数,并检查AC上是否设置了最大接入用户数限制。
AP与终端的射频模式不匹配
- 中国的2.4G频段支持1-13信道,部分水货终端如美版终端只支持1-11信道,检查是否是因为水货终端不支持12、13信道导致终端无法关联,可以通过将信道配置为1-11来解决该问题;
- 检查终端网卡支持射频模式与AP的射频模式,AC上可能配置了“只允许11n接入”的配置,如果有该配置,那么不支持11n的无线网卡无法关联。通过AC将射频模式配置为802.11bgn可解决该问题;
终端网卡支持的射频模式调节方式如下:
终端网卡射频模式:无线网络 > 属性 > 配置 > 高级 > 无线模式
portal认证问题
Portal认证失败常见问题如下:
- 推不出认证页面
- 无法认证成功
客户端无法推送页面处理步骤
- 检查设备和Web认证服务器之间、终端与Web认证服务器之间的链路是否存在故障。输入服务器的IP地址,查看是否能推送页面(如果直接输入服务器的IP地址也不能推送页面,需要检查服务器)
- 查看客户端浏览器上是否设置代理,如果有的话,将代理去掉。
- 如果直接输入服务器的IP地址能推出页面,但是输入域名无法推送页面,查看DNS服务器配置是否正确,将DNS服务器配置为运营商的公网DNS再次尝试。检查终端是否能ping dns服务器地址,查看终端dns服务器地址。
- 在portal服务器上添加设备时候,除了添加AC的ip地址外,还需要添加监听端口以及服务器密钥。监听端口默认为2000,服务器密钥需要AC上配置的密钥一直。
- 检查AP和AC通路上是否让业务vlan通过,如果不是,在AP到AC通路上选择一个端口,让业务vlan通过。如果问题还无法解决请联系汉明技术支持工程师。
无法认证成功处理步骤
检查用户名密码是否正确。
如果失败,检查radius服务器上用户名、密码配置。
检查AC上的“网络配置-认证配置-portal配置”中的端口号、密钥、portal服务器IP是否正确。
检查AC上的“网络配置-认证配置-radius配置”中的radius服务器地址、NAS IP、密钥配置是否正确;
检查AC上的“网络配置-认证配置-域配置”中的域选择的radius服务器地址是否正确;
如果问题还无法解决请联系汉明技术支持工程师。
802.1x认证问题
802.1x认证失败常见问题
- AC与Radius服务器不通
- AC不在Radius服务器可信任列表
- 配置错误
- radius服务器上配置的授权信息与设备上配置的授权信息不符
- 无法认证成功处理步骤
针对802.1x认证问题排查步骤如下:
- 检查AC是否能够ping通radius服务器
- 如果AC ping不通radius服务器,请更改AC到radius服务器通路上配置,使得AC能够ping通radius服务器。
- 检查AC是否添加到radius服务器可信任设备列表
- 检查AC上radius服务器配置
- 检查配置:radius服务器地址、认证端口号、计费端口号、密钥等要与服务器上配置一致。
- 确认用户认证时用户名是否正确,尤其注意域名部分,如果RADIUS服务器不接受带域名的用户名,可以配置将用户名的域名去掉,再发送给RADIUS服务器。
如果以上步骤仍未解决问题,需要通过抓取认证报文进行问题排查。抓包分析问题时需要在认证过程中同时在服务器侧和终端侧进行抓包:
在服务器上抓包排查
通过查看报文,如果前面交互正常,在TLS加密交互几步后EAP Failure,需要明确radius 服务器上配置的对应的用户名、密码所在的组中是否配置了授权信息,如果AC设备上并未配置对应的授权信息,则会使得eap-fail,此时在AC设备上添加对应的授权信息即可。
在终端上抓包排查
通过抓包,来查看用户不能正常上线的问题,如果发现用户并未发送eap-response,则查看sta的网卡配置是否正常;若发现eap success则用户已经认证成功,但用户仍无法上线,则查看是否是密钥协商问题,找密钥协商开发人员去定位。
如果问题还无法解决请联系汉明技术支持工程师。
终端无法获取IP地址问题
终端无法获取IP处理步骤:
- 确定客户端与服务器之间的链路是否有故障
- 检查客户端与服务器之间是否能ping通
- 检查配置
- 检查设备是否使能DHCP功能,检查转发模式、业务VLAN的相关配置,检查是否更改了配置没有下发给AP;
- 检查是否因为黑白名单、最大用户数导致无法获取IP。
- 检查设备是否配置DHCP地址池,并且地址池中的网段是否存在对应的网关
- 检查ip pool里的地址是否用完
用户业务中断问题(突然ping不通)
STA ping AC不通
STA ping AC不通问题排查步骤如下:
- 先通过STA抓包查看包是否已经发出。
- 可以通过AC上抓包,看ping包是否已经到达AC。
- 如果AC没有收到,就要看下报文是否到达AP,如果在AP上丢弃的,原因很快就可以查明。如果AP上也发出来了,那可能就是AP和AC中间网络的问题了。
- 如果AC已经收到,就看下ping 回应报文是否从AC发出。
- 如果发出,到AP上查看,是否收到ping回应报文。
AC ping STA不通
AC ping STA不通问题排查步骤如下:
- 先看STA是否收到ping包。
- 没有收到ping包,就检查ping 包是否达到AP。如果没有到达,就检查看AP和AC的中间网络。如果达到了,就看为什么没有发到用户。
- 如果STA收到ping包,就看下ping 回应报文是否达到AP。如果达到了,并且没有在AP上丢弃,就看是否是中间网络问题。如果达到了,在AP上丢弃,很快就可以定位。
用户漫游问题
无线终端从AC的一个AP漫游到同一个AC内的另一个AP中,称为AC内漫游。是否漫游由STA 发起,STA主要根据信号强度决定是否关联到另外的AP。
AC确定漫游的条件:
- AC内是否存在STA 数据;
- STA 切换是否为同一个AP(对于AC, 只有不同AP 间切换才走漫游处理)
重关联与漫游:重关联是STA掉线后重新关联,业务会有中断,而漫游不会掉线,业务不会中断。在AC的“网络监控-终端列表”中可以查询STA漫游次数以及每次漫游是在哪两台AP之间进行的。漫游需要有一定的前提条件:
- SSID 相同
- 安全策略相同
- 接口下认证相同
- 接口VLAN 容许通过
遇到不漫游问题首先根据以上条件检查配置。
用户不漫游
终端漫游是由STA发起的,是STA自身的行为,而STA 漫游通常根据信号强度决定是否漫游,定位终端不漫游可以从AP信号强度、STA漫游主动性两方面入手。
检查AP信号强度的覆盖
通过空口抓包或工具确认希望漫游的区域两个AP 的信号强度是否有个明显的差值,用户主要上网区域可控制在-40dBm~-65dBm是一个比较合理的范围。当信号强度<-75dBm时,大多终端会进行漫游,这个值通常是可以在客户端手动设置的。
检查STA漫游主动性
在确定信号强度覆盖合理的情况下,STA依然不漫游,可以通过替换STA来确定其它的终端是否漫游,如果其它终端漫游OK,那基本确定是终端的个体行为,可以通过设置终端的漫游主动性解决。设置方法见下图。如果其它终端同样不漫游,继续分析。
漫游是用户的行为,AC这边不可控制,可以在AC的“网络监控-终端列表”中查看漫游轨迹,确认用户有没有漫游。
用户上网慢
用户反馈的网速慢,一般是指在上网应用过程中出现的下载速度慢、打开网页速度慢等。网速慢的原因有:
- 用户接入速率低
- 无线环境恶劣,干扰严重
- 用户数过多
- 低速率用户过多引起网络性能差
- 有线网络质量差
- 终端网卡性能差
- 下载速度慢原因排查
- 终端接入速率低处理
下载速度慢原因排查
下载速度慢的原因除了上述原因外,还有FTP服务器、FTP软件和终端性能等因素影响。
FTP测试可采用DOS方式进行上传、下载,此时为单线程业务,速率可能受终端软件影响较大;推荐采用一些多线程FTP下载软件,例如Flashget,可避免终端软件原因导致下载慢。但请注意不要使用FileZilla软件,可能造成每10分钟发生一次断流等情况。
FTP服务器性能对下载速率影响很大。在测试过程中,需要关注FTP服务器是否稳定,是否出现丢包、乱序等情况,观察每次下载的速率变化是否有明显差异。最好采用多个FTP服务器进行下载对比,可排除由于FTP服务器性能不佳导致的速率问题。
若出现FTP下载速率低(排除限速的原因),或者下载不稳定的情况,则可能存在性能问题。
终端接入速率低处理
用户终端接入速率受网络和终端网卡性能影响,需进行排查和处理。
查看用户接入速率
用户接入速率可通过终端网卡状态查看,也可在AC的“网络监控-终端列表”菜单中进行查看。
如果速率用户过低,可先排查是否因终端网卡射频类型不匹配导致,如上所示,终端射频类型为11n,表示可接入802.11n类型的网络。如果是类型为11b,那么接入速率就会比较低。
查看无线网络配置
如果终端网卡性能较好,那需要排查网络配置是否正确,如果射频模板配置不正确,请修改成支持高速率的模式。
查看用户所在的AP绑定的AP模板,看配置的限速是多少,如果限速过低,可以解除限速或提高限速值。
用户ping丢包
丢包是指当采用ping进行网络测试时,出现丢包现象;或采用ping –l 指定大的数据包进行测试时,出现丢包现象。丢包现象可能出现的原因有:
- 空口信号弱
- 干扰大
- 有线链路存在丢包、延迟抖动大、广播风暴等情况
- 终端性能参数不佳
遇到ping丢包时可以通过ping不同长度的包进行初步判断,测试是否信号差导致丢包、测试是否因用户过多或低速率用户导致网络性能下降、检查是否有线链路状态差。
Ping测试时,可分别用“-l”选项指定不同长度的包,收集数据并反馈,举例如下:
# 检查www.hanmingtech.com是否可达,设置发送报文长度为0字节
C:\Users >ping www.hanmingtech.com -l 0 -n 10
正在 Ping www.hanmingtech.com [121.198.65.214] 具有 0 字节的数据:
来自 121.198.65.214 的回复: 字节=0 时间=42ms TTL=249
……….
来自 121.198.65.214 的回复: 字节=0 时间=30ms TTL=249
121.198.65.214 的 Ping 统计信息:
数据包: 已发送 = 10,已接收 = 10,丢失 = 0 (0% 丢失),
往返行程的估计时间(以毫秒为单位):
最短 = 30ms,最长 = 42ms,平均 = 31ms
# 检查www.hanmingtech.com是否可达,设置发送报文长度为1000字节
C:\Users >www.hanmingtech.com -l 1000 -n 10
正在 Ping www.hanmingtech.com [121.198.65.214] 具有 1000 字节的数据:
来自 121.198.65.214 的回复: 字节=1000 时间=43ms TTL=249
……….
来自 121.198.65.214 的回复: 字节=1000 时间=30ms TTL=249
121.198.65.214 的 Ping 统计信息:
数据包: 已发送 = 10,已接收 = 10,丢失 = 0 (0% 丢失),
往返行程的估计时间(以毫秒为单位):
最短 = 30ms,最长 = 43ms,平均 = 31ms
若出现丢包率高(>3%),平均延时大(>500ms)的情况,则可能存在性能问题。
按照用户接入信号差中的步骤进行操作,判断是否有干扰现象。测试是否因用户过多或低速率用户导致网络性能下降,为了保证用户的体验,会根据实际需求确定每个AP上最多关联多少用户。如果出现单个AP上关联的用户数过多,那么WLAN性能会降低,用户体验就会很差。
另外,如果用户网卡仅支持802.11b模式,或用户所处位置信号微弱,则用户与AP的关联协商速率将会降低,成为低速率用户。低速率用户将会拉低AP的整体性能。
如果有线链路存在丢包、延迟抖动大、广播风暴等情况,也会导致WLAN体验差。主要使用Ping命令检查链路状态。
如发现超过某长度阈值的包完全ping不通,可通过检查笔记本MTU的方法来验证是否网络存在无法传递大包的情况。
登录AC之后,使用“show ap info all”命令可查询AP的IP地址。然后使用Ping命令,对AP的地址进行测试,如发现网络不稳定,存在丢包等现象,可使用ping命令对中间节点进行ping操作,逐个进行排查。
排查网络中是否存在广播风暴
登录网络中交换机后,使用命令查看端口收发广播/组播包情况。如果短时间内端口收发大量的广播/组播报文,也会降低wlan性能。
热点无法搜索到信号问题
热点无法搜索到信号的主要原因有:
1)终端原因:网卡是否打开?连接是否禁用?模式是否兼容?其他终端是否能搜索到信号?逐一检查以上原因,并最终解决。
2)覆盖不足:覆盖存在信号死角和盲区,导致部分区域无法搜索到信号,可以通过频谱仪或信号扫描软件检测信号强度,扫描信号强度低于-75dbm时,该区域属于弱覆盖,使用效果难以得到充分保障;覆盖不足必须通过调整点位、更换大功率设备或增加点位解决。
3)AP/AC、交换机等传输链路设备故障:在AC+瘦AP组网的场景中,默认情况下AP离线后会自动关闭射频;在AC的AP信息中检查是否存在离线AP,恢复网络链路,解决离线故障;如果局点的AP频繁离线,需要在AC上开启HAP功能,将该局点AP加入到HAP组中。
4)参数配置问题:是否开启了SSID隐藏?信号强度是否设置过低?信道配置是否与终端接收信道范围不匹配?AP是否忘记配置瘦AP模板?需逐一检查AC上的配置。
5)更换AP尝试搜索信号。
苹果手机关联到WIFI后无法推送Portal页面
采用Portal认证时,同一台AP下安卓手机、笔记本电脑都可以正常推送portal页面,但部分iOS 9.3.2版本的苹果手机无法推送Portal页面。解决办法:
-
- 将苹果手机上的部分APP如微信、QQ卸载后可以正常推送Portal页面;
- 为了保障用户的使用体验,在AC上将苹果终端的OUI信息配置好,通过BYOD功能对这部分苹果终端进行放行,不做认证。
手机安装WIFI万能钥匙后无法推送Portal页面
手机安装WIFI万能钥匙后,不论苹果手机还是安卓手机都会遇到无法推送portal页面的问题,遇到这类问题先和用户解释清楚,然后将用户的WIFI万能钥匙卸载,重新关联WIFI后即可推送Portal页面。
除了WIFI万能钥匙外,还有平安WIFI APP也会出现类似问题。
以上为无线网络常见故障,请维护人员收到客户投诉后根据客户描述的现象仔细排查,排查完成后记录排查结果并解决。