今天在工作中碰到一个奇怪的现象:
原来好好的程序,部署在一台服务器上之后,无法发现网络中的设备。
背景
这个程序(下称检测程序)是用来为网络中的设备做配置用的,当程序进入网络之后,会主动发现网络中的设备,并通过列表将设备展示出来,提供操作人员设置。
发现设备的机制是向所在网络中定时发送特定的 UDP 消息,当网络中的设备接收到消息后,会做一个回应,从而建立于检测程序的关联。
问题
由于开发环境发生变化,将程序部署在了另外一台机器上了。准备调试时,才发现无论网络中接入多少设备,检测程序都不能发现。
于是各种找原因,最后通过交叉测试才发现,检测程序所在的服务器无法发送UDP 广播,即向 255.255.255.255
地址发送 UDP 消息。
解决
检查网络设置
下面命令可以查看特定的网络配置
sysctl net.ipv4.ip_forward
sysctl net.ipv4.conf.all.accept_redirects
sysctl net.ipv4.conf.default.accept_redirects
net.ipv4.ip_forward
:控制是否允许IP转发。net.ipv4.conf.all.accept_redirects
:控制是否接受 ICMP 重定向。net.ipv4.conf.default.accept_redirects
:同上,但应用于默认接口。
如果他们的值不是 1
、0
、0
,通过下面的方法设置:
sudo sysctl -w net.ipv4.ip_forward=1
sudo sysctl -w net.ipv4.conf.all.accept_redirects=0
sudo sysctl -w net.ipv4.conf.default.accept_redirects=0
检查防火墙设置
先检查防火墙是否允许:
sudo iptables -L
如果发现某个 Chain 阻止了广播,可以添加一条允许规则:
sudo iptables -A OUTPUT -d 255.255.255.255 -j ACCEPT
重启网络
sudo systemctl restart networking
或者
sudo systemctl restart network
看具体情况而定
后记
这里整理几个调试过程中使用到地方法
-
监听网络中的 UDP 广播
nc -u -l <port_number>
-u
参数指定netcat使用UDP协议。-l
参数告诉netcat监听传入连接。<port_number>
替换为你想要监听的端口号。
如果没有 nc 命令,这样安装(以 ubuntu 为例):
sudo apt-get install netcat
-
发送 UDP 广播
import socket import logging def send_msg(message, ip="255.255.255.255", sendport=5002): udp_socket = socket.socket(socket.AF_INET, socket.SOCK_DGRAM) if ip == "255.255.255.255": udp_socket.setsockopt(socket.SOL_SOCKET, socket.SO_BROADCAST, 1) result = udp_socket.sendto(message, (ip, sendport)) print(f"send_msg: ip:{ip}, port:{sendport} result:{result}") send_msg(b"test") # 发送广播消息