目录
网络不通是Linux系统管理员经常遇到的问题。为了有效地解决这类问题,我们需要按照一定的步骤进行排查。下面是一些基本的排查步骤,以及如何通过命令的执行结果来分析问题。
一. 检查物理连接
首先,确保所有的网络硬件设备(如网线、路由器、交换机等)都已正确连接。检查网线是否损坏,接口指示灯是否正常。
二. 查看网络接口状态
使用ip a命令查看网络接口的状态。
ip a
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN mode DEFAULT group default qlen 1000
inet 127.0.0.1/8 scope host lo
valid_lft forever preferred_lft forever
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP mode DEFAULT group default qlen 1000
inet 192.168.1.10/24 brd 192.168.1.255 scope global dynamic eth0
valid_lft 86394sec preferred_lft 86394sec
分析结果:
lo接口是本地回环接口,状态为UP,表示本地网络栈应该是正常的。
eth0接口是以太网接口,状态也为UP,并且已经分配到了IP地址192.168.1.10,这表明网络接口已启用并且可能已经连接到了本地网络。
三. 测试网络连通性
使用ping命令测试网络连通性。
首先ping本地回环地址127.0.0.1,然后ping本地网关,最后ping外部网站如google.com。
ping -c 4 127.0.0.1
ping -c 4 192.168.1.1
ping -c 4 google.com
ping命令常用参数解析
-t:在 Windows 系统中,该参数使 ping 命令持续发送数据包到目标主机,直到用户手动停止(使用 Ctrl+C)。在 Linux 或 macOS 中,ping 默认就是持续发送数据包,直到用户手动停止。
-n(Windows)/-c(Linux/macOS):后跟数字,指定发送的回显请求数量。
-w(Windows)/-W(Linux/macOS):后跟时间(毫秒/秒),设置每次回显请求的超时时间。
-l(Windows)/-s(Linux/macOS):后跟数字,设置发送数据包的大小(字节)。
-i(Linux/macOS):设置TTL(Time To Live)值,即数据包在网络中的最大跳数。
分析结果:
本地回环地址127.0.0.1能够ping通,说明本地网络栈没有问题。
假设ping本地网关的结果显示无法ping通,那么可能是本地网络配置问题或网关设备问题。
如果ping外部网站失败,可能是DNS解析问题或外部网络问题。
四. 检查路由表
使用route -n命令查看路由表,确保路由配置正确。
route -n
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
0.0.0.0 192.168.1.1 0.0.0.0 UG 100 0 0 eth0
192.168.1.0 0.0.0.0 255.255.255.0 U 100 0 0 eth0
分析结果:
第一行显示了默认路由(0.0.0.0),表示所有非本地网络的流量都将通过网关192.168.1.1进行路由。UG标志表示这是一个可用的网关,eth0表示流量将通过eth0接口发送。
第二行显示了本地网络的路由,192.168.1.0是本地子网,255.255.255.0是子网掩码,U标志表示这个路由是活跃的,流量将直接通过eth0接口发送到本地网络上的其他主机。
如果默认路由缺失或错误,可以使用ip route add命令添加或修改路由。
五、检查DNS解析
使用nslookup或dig命令检查DNS解析是否正常。
nslookup google.com
Server: 192.168.1.1
Address: 192.168.1.1#53
Non-authoritative answer:
Name: google.com
Address: 172.217.16.206
分析结果:
DNS解析正常,能够解析出google.com的IP地址,说明DNS服务工作正常。
如果可以ping通ip,而不能访问域名,则需要很大可能是dns域名解析问题,需要添加dns
解析。编辑/etc/resolv.conf文件,添加或更改nameserver行:
nameserver 8.8.8.8
nameserver 8.8.4.4
六. 检查防火墙设置
使用iptables或firewalld命令检查防火墙设置,确保没有阻止网络连接的规则。
iptables -L
Chain INPUT (policy ACCEPT)
target prot opt source destination
Chain FORWARD (policy ACCEPT)
target prot opt source destination
Chain OUTPUT (policy ACCEPT)
target prot opt source destination
分析结果:
防火墙规则显示所有链的默认策略是ACCEPT,没有明显的阻止规则,这意味着防火墙可能不是导致网络不通的原因。
七. 查看系统日志
查看系统日志文件,如/var/log/syslog或/var/log/messages,可能会发现网络服务或硬件相关的错误信息。
cat /var/log/syslog | grep network
分析结果:
如果日志中有网络相关的错误信息,它们可能会提供网络不通的原因。
八. 使用网络诊断工具
Linux系统中有许多网络诊断工具,如netstat、ss、traceroute、tcpdump等,可以帮助进一步诊断网络问题。个人最推荐使用traceroute可以帮助确定数据包在到达目的地之前在哪里停止。
traceroute google.com
traceroute to google.com (172.217.16.206), 30 hops max, 60 byte packets
1 192.168.1.1 (192.168.1.1) 1.123 ms 1.079 ms 1.044 ms
2 * * *
3 * * *
...
分析结果:
第一跳到达了本地网关192.168.1.1,但是后续的跳数都没有响应,这可能表明问题出在本地网络之外。
如果有两张网卡,那么可能有两条默认路由,就要看看第一跳的网关是否正常,如果不对,则需要修改默认路由,或者添加一条路由明细
查看当前路由表:
route -n
删除错误的默认路由:
ip route del default via <错误的网关IP>
添加新的默认路由:
ip route add default via <正确的网关IP>
添加具体的路由明细:
ip route add <目的网络> via <网关IP> dev <网卡设备名>
九、 使用curl命令测试网页访问
当无法访问某个网页时,除了检查DNS解析和路由之外,还可以使用curl命令来测试网页的可访问性。curl是一个强大的命令行工具,用于发送请求到服务器并获取内容。
curl -I <网页URL>
HTTP/1.1 200 OK
Date: Mon, 24 Jan 2024 12:00:00 GMT
Server: Apache/2.4.41 (Ubuntu)
Last-Modified: Mon, 24 Jan 2024 11:57:53 GMT
ETag: "2c3-5a2e760b6f640"
Accept-Ranges: bytes
Content-Length: 707
Vary: Accept-Encoding
Content-Type: text/html
使用-I选项可以仅获取HTTP响应的头部信息,这对于检查网页是否可达非常有用。
分析结果:
HTTP状态码为200 OK表示网页是可访问的,服务器成功处理了请求。
如果返回的状态码是4xx(如404 Not Found)或5xx(如500 Internal Server Error),则表明网页存在问题。4xx错误通常指客户端错误,如URL输入错误或页面不存在;5xx错误则表示服务器端问题。
如果curl命令返回的是连接超时或者没有响应,那么可能是网络连接问题,或者服务器没有响应。这时,你可以结合前面的traceroute结果来进一步分析问题所在。