拓扑结构:
WS3302(无线控制器)----------3760E-24P(poe供电交换机)-----------AP220E(c)
故障现象:
AP可获得IP地址,并能与AC成功建立capwap 隧道。
但是大约一分钟后AC提示AP leave AC
*Jul 1 15:11:14: �PWAP-3-DOWN:
Cannot receive reply from 10.10.10.4 : 10000.
*Jul 1 15:11:14: �PWAP-7-TUNNEL: Tunnel deleted : source ip is
1.1.1.1 , dest ip is 10.10.10.4.
*Jul 1 15:11:14: %7: CAPWAP: CTI destroy interface.
*Jul 1 15:11:15: %APMG-6-RX_CTRL_MSG:
AP(1414.4b57.3db0:1414.4b57.3db0) leave AC.
AC端的debug消息也显示了capwap down的原因是没有收到AP的 reply
故障分析;
1.隧道建起后断开,通常属于AC与AP版本不匹配导致
因此定位为版本不匹配。
2.长ping AP发现,隧道断的时候,伴随着AP不可达
因此定位为AP上线后有重启行为。
版本不匹配不会导致重启吧? 思维转向了poe供电
3.到交换机查看,频繁报出如下log:
*Jul 1 12:10:58:
%POE-6-LINKDOWN: Interface FastEthernet 0/1 link state changed to
down with PoE being on.
*Jul 1 12:10:59: %LINK-3-UPDOWN: Interface
FastEthernet 0/1, changed state to down.
*Jul 1 12:10:59: %LINEPROTO-5-UPDOWN: Line
protocol on Interface FastEthernet 0/1, changed state to
down.
*Jul 1 12:11:01: %LINK-3-UPDOWN: Interface
FastEthernet 0/1, changed state to up.
*Jul 1 12:11:01: %LINEPROTO-5-UPDOWN: Line
protocol on Interface FastEthernet 0/1, changed state to
up.
发现了POE
linkdown字样,思路局限在poe供电不稳
几番苦痛的纠结……
后台工程师定位:
*Jul 1 12:10:58:
%POE-6-LINKDOWN: Interface FastEthernet 0/1 link state changed to
down with PoE being on.
这调log的意思是:f0/1口down了 ,但是poe是正常运行的
锐捷早就想到了重启的故障点定位问题,当接口down的时候,专门产生如此log来指示端口down跟poe的关系。
事后反思:
其实log信息已经写的很清楚了,自己没认真解读
ping
AP的时候有个蛛丝马迹:先ping不通,后交换机报出端口down的信息。(说明重启在前,端口down在后)
AC跟AP版本不匹配的现象一切皆有可能:隧道起不来、隧道重启、配置无法下发、隧道建立后AP重启……
锐捷wlan实施中,大家一定要跟厂家核对好版本哦……
今天真的很失败……
以此文,自告诫!