neighbour table overflow 问题解决

接到保障,说某来机器服务没法访问,于是,准备连接到机器上去看个究竟.

尼玛居然连不上,连ping都ping不通,无奈只能求助机房. 机房人员检查, 发现报 neighbour table overflow 错误. 无奈让机房的人员重启了服务器.


查找原因,搜索得到如下说法:


第一种说法:

内核维护的arp表过于庞大, 发生抖动, 因此导致了这种情况,几个内核ARP参数:
=================================
gc_stale_time
决定检查一次相邻层记录的有效性的周期。当相邻层记录失效时,将在给它发送数据前,再解析一次。缺省值是60秒。
gc_thresh1
存在于ARP高速缓存中的最少层数,如果少于这个数,垃圾收集器将不会运行。缺省值是128。
gc_thresh2
保存在 ARP 高速缓存中的最多的记录软限制。垃圾收集器在开始收集前,允许记录数超过这个数字 5 秒。缺省值是 512。
gc_thresh3
保存在 ARP 高速缓存中的最多记录的硬限制,一旦高速缓存中的数目高于此,垃圾收集器将马上运行。缺省值是1024。
=================================
比如arp -an|wc -l的结果是300左右, 那么应当调高gc_thresh各项数值,防止抖动的发生:
echo "net.ipv4.neigh.default.gc_thresh1 = 512" >> sysctl.conf
echo "net.ipv4.neigh.default.gc_thresh2 = 2048" >> sysctl.conf
echo "net.ipv4.neigh.default.gc_thresh3 = 4096" >> sysctl.conf

或者

echo 120 > /proc/sys/net/ipv4/neigh/default/gc_stale_time
echo 512 > /proc/sys/net/ipv4/neigh/default/gc_thresh1
echo 2048 > /proc/sys/net/ipv4/neigh/default/gc_thresh2
echo 4096 > /proc/sys/net/ipv4/neigh/default/gc_thresh3

第二种说法:
默认路由或者子网掩码设置错误,检查

第三种说法:
内核编译错误

第四种说法:
原来那台机器的iptables没有开,不知道开了以后会不会好了,等等看吧。


于是查看了下 ARP 表,发现ARP表不断的在增长.一度增长到730多条记录.理论上来说,机器应该只会保存一条ARP记录,就是网关的.而现在保存了很多条记录,都是公网IP对应网关MAC地址的记录.以为是机器被人入侵了,种下了ARP欺骗神马的程序. 通过 tcpdump 抓包发现,确实是本机不断的在发送ARP请求包. 找了一个多小时,硬是没找到原因.

后来通过访问本机上的某个服务,ARP表中立即就增加了一条ARP记录. 是我的出口的IP,对应的服务器网关的MAC.

于是,理了一下思绪,为什么ARP表中的记录不是网关的MAC,而是直接对应我用户的公网IP和服务器网关的MAC地址.看一下网络通信的流程:


1. 用户请求服务器的服务到达服务器

2. 服务器响应请求,首先查找本机的路由表,如果有路由,直接通过该接口将数据丢过去.如果没有路由,则将数据丢给默认网关.

3. 丢数据出去,得解析ARP,将IP转换为MAC地址. 二层都是通过MAC地址通信的嘛

4. 于是查找本地的MAC地址表,有记录则发送过去.没记录,则广播ARP. 问谁是 x.x.x.x .

5. 现在的问题很显然是服务器在不断的广播ARP,而响应的则是服务器网关.而服务器网关是交换机.顺便查了下,交换机的代理ARP功能. 而这个功能交换机一般默认都是开启的.

6. 于是不断的添加ARP记录到ARP表中,都是用户的访问IP和网关的MAC地址

6. 尼玛去查了一下路由表,震惊了. 网关居然配置的自己本身的接口IP地址,而不是网关的IP. 怪不得.

7. 默认路由是自己的接口IP,为嘛还能与外界通信? 因为服务器是跟网关直连的呀! 我勒个擦


所以, 我这个问题,验证了第二种方法,默认路由或者子网掩码设置错误!

而这个错误,导致了ARP记录过于庞大,最终服务器挂了.




  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是一个使用A*算法解决八数码问题的Python实现: ```python from queue import PriorityQueue class Board: def __init__(self, board): self.board = board self.zero_pos = self.get_zero_pos() self.g = 0 self.h = self.get_h() def __lt__(self, other): return self.g + self.h < other.g + other.h def __eq__(self, other): return self.board == other.board def __str__(self): return '\n'.join(' '.join(str(x) for x in row) for row in self.board) def get_zero_pos(self): for i in range(3): for j in range(3): if self.board[i][j] == 0: return (i, j) def get_h(self): h = 0 for i in range(3): for j in range(3): if self.board[i][j] != 0: x, y = divmod(self.board[i][j]-1, 3) h += abs(x-i) + abs(y-j) return h def get_neighbours(self): neighbours = [] i, j = self.zero_pos if i > 0: neighbour = [row[:] for row in self.board] neighbour[i][j], neighbour[i-1][j] = neighbour[i-1][j], neighbour[i][j] neighbours.append(Board(neighbour)) if i < 2: neighbour = [row[:] for row in self.board] neighbour[i][j], neighbour[i+1][j] = neighbour[i+1][j], neighbour[i][j] neighbours.append(Board(neighbour)) if j > 0: neighbour = [row[:] for row in self.board] neighbour[i][j], neighbour[i][j-1] = neighbour[i][j-1], neighbour[i][j] neighbours.append(Board(neighbour)) if j < 2: neighbour = [row[:] for row in self.board] neighbour[i][j], neighbour[i][j+1] = neighbour[i][j+1], neighbour[i][j] neighbours.append(Board(neighbour)) return neighbours def solve_puzzle(start_board): start_node = Board(start_board) end_board = [[1,2,3],[4,5,6],[7,8,0]] end_node = Board(end_board) visited = set() queue = PriorityQueue() queue.put(start_node) while not queue.empty(): node = queue.get() if node.board == end_node.board: return node.g visited.add(node) for neighbour in node.get_neighbours(): if neighbour not in visited: neighbour.g = node.g + 1 queue.put(neighbour) return -1 if __name__ == '__main__': board = [[1,2,3],[4,5,6],[7,0,8]] moves = solve_puzzle(board) if moves == -1: print('Unsolvable puzzle.') else: print('Number of moves required:', moves) ``` 该实现使用了一个`Board`类来表示八数码问题中的一个棋盘状态。该类包含了棋盘状态、空格位置、g值(从起始状态到该状态的距离)和h值(该状态到目标状态的估计距离)等信息。 在`solve_puzzle`函数中,我们使用了一个优先队列来存储待搜索的状态。每次从队列中取出g+h最小的状态进行搜索。如果该状态是目标状态,则返回该状态的g值作为答案。如果搜索完所有状态都没有找到目标状态,则返回-1表示该八数码问题无解。 该实现的时间复杂度为O(b^d),其中b是每个状态的平均分支因子,d是目标状态的深度。在八数码问题中,b的值大约为2.5,d的最大值为31,因此该算法的时间复杂度为O(2.5^31),是可以接受的。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值