运维 常见故障排查

常见名词含义
1、IP地址
IP地址是个32位的2进制数,是个虚拟的地址,通常我们把IP地址的每8位翻译成一个10进制数,然后用“.”分隔开来,所以也称之为点分十进制表示法。比如说192.168.1.1、10.1.1.2等。
IP地址分为A\B\C\D\E五类,同时也有公有地址跟私有地址的区分。这里只讨论公有与私有的区分。公有地址的含义是可以在INTERNET上传输的地址,反之不能在INTERNET上传输的就是私有地址。私有地址有以下几个段:10.0.0.0-10.255.255.255、172.16.0.0-172.31.255.255、192.168.0.0-192.168.255.255,其他的都是共有地址,当然还有127.0.0.0/8是本地环回地址。
子网掩码的含义,子网掩码的作用是用来区分网段与节点的位置,比如说32位的IP地址,前面24位表示网段,后面8位表示节点地址的话,掩码就是255.255.255.0。在交换式的网络中只有在同一网段的主机才可通信。
2、DNS服务器
DNS是域名解析服务器,作用是用来把域名解析成IP地址,这样计算机就能在网络找到相应的WEB服务器了。比如说www.sina.com.cn,这个地址计算机是不认识的,必须要靠DNS来解析这个域名的地址,换句话说DNS就好比是翻译。我们长宽的DNS有211.162.31.8跟211.162.31.9,南京电信的DNS有218.2.135.1跟202.102.24.35。
DNS只跟浏览网页有关,跟其他的应用没有关系。DNS自动获取就可以了,也可以手工指定,但是一定要设置正确的DNS。
3、带宽
带宽是上网的时候用户跟INTERNET互联的带宽,就好比道路的宽度是一样的。带宽的单位是bit/s(比特/秒)。带宽分上行跟下行。这里一定要跟下载速度区分开来,下载速度的单位是Byte/s(字节/秒)。一个Byte是8个bit。b/s与B/s一定要分清楚。
4、PING
Ping命令是用来检测连通性最常用的工具。这是个DOS命令,必须在DOS窗口下运行。一般格式是ping 目标地址 回车,比如ping 192.168.1.1 。也可以跟一些参数,比如-t-l,如ping 192.168.1.1 –t –l 1024 ,这个的含义是一直ping直到手工终止,并且包的大小被指定为1024个字节。下面是几张截图:

常见故障以及解决办法

一、终端用户类
1、691
691故障可能原因有 A 用户名或者密码错误
B 机房捆绑错误
C 账号已经到期
D 账号已经登陆
691的处理方法是查看BOSS的错误日志。

2、678和815
678是我们遇到最多的故障现象了。可能引起的原因也是最多,虽然它的解释就一句“远程计算机没有相应”。下面就把可能的原因列出来:
A 线路故障 用户电脑一直到拨号服务器之间的线路不通
B 设备故障 用户电脑一直到拨号服务器之间任何一台设备损坏
C 用户使用了路由器
D 存在环路
E 用户电脑网卡损坏
处理这种678的故障有一个诀窍:故障一定出现在所有出现678故障的电脑的公共位置。比如说同楼道2个用户出现678,那就去找这2家用户入户线的公共位置,很显然是楼道交换机处;如果同一栋楼不同楼道的4家用户出现了678,那就去找这4家用户的公共位置,很显然是楼道光电所在地;整个小区都是678,那就去找这整个小区的用户线路的公共位置,那显然是社区机房了。

3、769
原因:A 用户电脑网卡被禁用
B 用户电脑网卡驱动没有安装或者没有正确安装

4、676、619等
原因:A 账号已经登陆
B 拨号软件损坏
C 电脑尚未完全启动
D 错误678的原因都有可能
E 设备丢包严重

5、故障现象:网页打不开,能PING通网关,游戏也正常。
原因:A 我们的DNS服务器未正常工作
B 设置了错误的DNS服务器(正常的是211.162.31.8跟211.162.31.9)
C 设置了浏览器代理
D 用户电脑系统故障

6、故障现象:PING网关丢包。
原因:A 设备本身存在丢包(网卡、交换机、光电等)
B 接触不良,多半出现在水晶头、模块、网卡等接头处
C 线路拥塞,比如网内有中毒电脑在发送大量的数据包。

7、故障现象:获取到192开头的IP地址。
先说明一下,有3个段的IP地址是私有地址,10.0.0.0-10.255.255.255,172.16.0.0-172.31.255.255,192.168.0.0-192.168.255.255。私有地址的意思就是谁都可以使用的IP地址,不需要申请跟付费,但是这种地址不能在广域网中出现。我们的认证服务器所分配的IP地址均为公有地址。如果获得以上3个地址段的任何一个IP地址,这说明在用户电脑的附近存在一台DHCP服务器。
原因:A 手工指定的静态IP地址
B 用户家使用了路由器
C 本小区内存在代理服务器

8、故障现象:网络电缆被拔出
说明用户家电脑至最近的一台交换机间线路不通,这时候拨号也是显示678。
原因:A 线路不通
B 网卡损坏
C 线缆类型不对,使用的是交叉线而非直通线
D 对端设备损坏
E 网卡速率与交换机的速率不一致

9、故障现象:打开网页慢、游戏慢。
这里的速度慢主要的参照对象是比平时使用时的速度。其实这两种现象要分开来讨论。网页打开慢,是大多数网页还是个别网站,这里只讨论大多数网站的情况。
原因:A DNS服务器相应慢
B 线路拥塞
C 存在丢包(到网关)
D 浏览器中病毒,CPU使用率过高甚至100%
玩游戏(网络游戏)速度慢的原因:
A 游戏服务器人数过多
B 游戏服务器故障
C 电脑中病毒
D 到达游戏服务器的数据包延迟过高,甚至丢包
E 到网关就存在数据包丢失

10、故障现象:本地连接显示10M或者100M
本地连接显示的10M或者100M的意思是网卡到我们最近的一台设备之间的链路速度是10M或者100M,并不是指本身的带宽就是这么多。一般情况下我们的交换机都是10/100M自适应的,意思就是可以自动根据对端的设备来改变自身的速率。我们的五类线也是支持100M传输速率的。用户的网卡一般也是10/100M自适应的。所以一般情况下用户家电脑上本地连接显示是100M。如果出现10M的可能原因有:
A 交换机端口只支持10M
B 手工更改了网卡的速率为10M
C 线路衰减很大,一般是网线过长(超出100米)
D 附近存在电磁波干扰

11、故障现象:本地连接受限制或者无连接
其实这种现象是正常的。我们现在采用的是PPPOE认证方式,PPPOE是基于以太网的点对点协议。这种认证方式与普通的网页认证加DHCP的方式的区别是需要上网的时候,用户需要拨号,向拨号服务器发送账号与密码,如果通过了,拨号服务器会分配一个合法IP给拨号请求者。在用户的电脑上我们会发现多了一个宽带连接,其实这是一个虚拟的本地连接。它是基于真实的物理网卡所创建的虚拟网卡。所以原来的本地连接就会显示受限制,IP地址分给了这个虚拟的网卡。这个时候真实的网卡是不能禁用的。

12、故障现象:拨号正常,网页打不开,游戏上不了
原因: A 电脑的操作系统故障
B 大网出口中断
C 楼道交换机损坏

13、故障现象:用户使用路由器后不能上网
原因:A 路由器没有设置成PPPOE模式
B 路由器的DHCP功能没有打开
C 进户线未插在路由器的WAN口
D 路由器本身是坏的

14、故障现象:用户使用路由器后一台电脑可以上网,另一台却不可以
原因:A 路由器的DHCP功能没有打开,能上的那台设置了静态IP跟路由器正常互联,不能上网的那台却没有设置IP地址
B 路由的LAN口有坏口
C 不能上网的电脑本身的问题(软硬件故障)

15、暗线问题
暗线问题主要是找线的过程,一定要准确。一般装修过的房子都会放暗线,但是每家的布线都是不一样的,不过有个共同点,线虽然在墙里,但是线头必须在墙外。先找线头,再通过测线仪测线把具体布线情况找出来。最常见的布线方法有三种:
A 在客厅汇总,然后分别与每个房间连接,再引一根线与户外线连接;
B 每个房间的线都直接放到户外
C 一根线进户,然后经过每个房间,形成串联
这三种情况下,接线方式稍微有些不同,如果是用户不使用路由器,那么就没有区别,如果是使用路由器,要同时几台电脑上网,接线方式就不一样。第一种情况只需要将路由器放在客厅,就可以保证每个房间都能上网;第二种情况下就比较麻烦,因为路由器不能放到户外。但是这路有个小技巧,用户家的线都是8芯五类线,我们可以把路由器放在任何一个房间,用其中4芯将进信号给路由器,再用剩下的4芯与另一个房间的线对接,这样就可以保证2个房间的上网了;第三种情况也可以参照第二种情况的方法,来保证2个房间的上网。
在测试线路的时候一定要节省水晶头,不要把每个线头都打上水晶头再来测线,只需要在一头打上水晶头,在另一边将线短路就可以测试了。

题目:1、在客厅有3个线头,分别连到3个房间,如何以最快的速度把线找对?
2、在一根暗线的两头都打上A类水晶头,测试结果是,发送端与接收端都是124567亮,这根线是否还可以使用?
3、在用户家发现有一个房间的线打上水晶头后,接上测线仪的发送端后发现12345678按顺序亮,能说明什么问题?
4、在用户家发现有一个房间的线打上水晶头后,接上测线仪的接收端后发现12345678按顺序亮,能说明什么问题?

16、家用路由器
现在的家庭有多台电脑的情况已经很多了,要实现共享上网最好的方法就是买个家庭路由器,价格便宜,简单方便。家庭路由器一般是1个WAN口加4个LAN口,WAN口用来接进线,LAN口接电脑。具体的配置要看宽带运营商的上网方式,是自动分配地址的(DHCP)还是PPPOE拨号,还是静态地址类型。就南京长宽而言有两种方式,家庭用户一般都是PPPOE拨号,商业客户一般都是静态地址。所以在设备路由器的时候一定先要知道是哪种上网方式。另外路由器还有DHCP的功能,可以给LAN口自动分配私有IP地址。有3个段的IP地址是私有地址,10.0.0.0-10.255.255.255,172.16.0.0-172.31.255.255,192.168.0.0-192.168.255.255。私有地址的意思就是谁都可以使用的IP地址,不需要申请跟付费,但是这种地址不能在广域网中出现。各个厂商的路由器分配的地址可能不一样,但是原理都是一样的。使用路由器的时候一定要注意,不要将进线接到LAN口,这样的话不但起不到路由器的作用,还会给其他用户分配似有IP地址。

问题:1、用户家电脑接上路由器后,本地连接受限制,说明什么问题?
2、用户家电脑接上路由器后,可以开QQ,网页打不开,说明什么问题?

17、具体应用
具体应用指具体的游戏、网站等应用,可能会出现打开慢或者掉线之类现象,这个时候最好查看下对应服务器的IP地址。如果是网站可以使用Ping、nslookup、netstat命令来查看对应的IP地址,如果是游戏,可以登陆后使用netstat 命令来查看对应服务器的IP地址。查到后发邮件给网管,告诉他具体的问题现象以及查到的IP地址跟端口号。网管收到邮件后查看到达这些服务的路径,来选择调整。最简单的办法就是网通的服务器的话,就让访问这个服务器的流量从网通接口出去,如果是电信服务器,就从电信接口出去,来达到传输的最佳效果。具体的应用还有很多,比如邮件、VPN、炒股软件等等,具体解决步骤都是大同小异,先查到对端IP地址,再让网管来查看具体的数据路径,再选择调整。

问题:1、如何查看www.163.com的IP地址?
2、如何查看QQ游戏的IP地址?

18、操作系统问题
操作系统的故障也是比较频繁,显而易见的比如:死机、蓝屏、启动不了等,不易察觉的有:拨号678、浏览器打不开等。如果是操作系统故障最好能用另一台正常的电脑来作比较,好让用户相信我们所说的问题。那么在重新做系统的时候要注意以下几点:1、征得用户同意;2、做好文件备份;3、做好驱动备份;4、最好不要打开机箱;5、把常用软件帮用户装好;6、保证可以上网。其实最重要的不是要把系统做的多么专业,而是要跟用户沟通,拉近跟用户的距离,不要自己做自己的。

19、排线问题
用户家里或者户外如果要排线,一定要遵循以下几点要求:1、横平竖直,隐蔽并且美观;2、不要与强电过于靠近或者平行走线;3、遵循100M规则;4、线一定要固定牢固;5、尽量不要走门缝等容易被挤压到的地方;6、征得用户的同意方可走线。最主要的是第3条遵循百米规则,我们所使用的五类线,要保证100兆的传输速率,就必须遵循这个规则。在实际的使用过程中,不可能做到那么的准确,如果感觉比较远,或者用户家的电脑网卡不能启用100M的速率,那么必须在中间增加一个信号放大设备,比如交换机。如果在中间位置不能架设机箱,那么就必须使用光纤来代替五类线。

问题:有一家拉线用户,距离比较远,肯能有130米,用户家电脑的本地连接显示“本地电缆没有插好”,有什么解决办法?

20、水晶头
五类线所使用的水晶头称之为RJ45水晶头,跟电话线所使用的RJ11是有区别的。RJ45是8针,RJ11体积上要稍小,只有2针。
水晶头的制作规范有两种,T568A跟T568B,两种打法是世界通用的标准。
T568A的线序是:白绿、绿、白橙、蓝、白蓝、橙、白棕、棕
T568B的线序是:白橙、橙、白绿、蓝、白蓝、绿、白棕、棕

这里的白绿、白蓝指的是跟对应颜色相缴的白线。
长宽所使用的是A类线序,只要不说明的地方一律使用A类线序。
直通线与交叉线的概念:
直通线:线的两端是一致的打线顺序,都是A类或者都是B类,称为直通线。
交叉线:线的两端是不一致的打线顺序,一都是A类,另一头是B类称为交叉线。
直通线跟交叉线使用的地方稍微有所区别。
如果两端的设备是一致的需要使用交叉线;如果两端的设备是不一致的设备需要使用直通线。比如:
电脑 交叉线 电脑
交换机 交叉线 交换机
交换机 直通线 电脑
交换机 直通线 光电
当然实际应用中会有些不一样,有些设备是比较智能的,它会自动判断需要使用的线缆类型来自我调整,比如交换机与交换机本来是需要交叉线来互联的,但是使用了直通线,那么这些智能交换机会自动把对应的端口改成交叉口而保证链路的正常建立。当然我们在实际工作中不能依赖这些智能设备,该使用何种线缆就使用何种线缆。
水晶头出现故障还是比较少的,比较常见的故障是:1、在制作水晶头的时候没有压好导致松动,时间常了就会解除不良;2、水晶头被氧化导致接触不好;3、在压线的时候弹片弯了,导致接触不好引起丢包。遇到水晶头故障的时候处理起来很简单,只要重新做一个就好,主要是在找故障的时候我们往往会忽略水晶头故障,所以在处理任何故障的时候都要细心一点,不要放过任何可能原因。
问题:一楼道中使用华硕8口交换机,用户可以上网,但是换成GES1008后,其中一个用户家电脑显示“本地电缆没有插好”,可能原因?怎么解决?

二、楼道类
1、光电收发器
光纤与五类线的区别,它们所承载的信号也是不一样的,光纤是光信号,五类线是电信号。光电转换器的功能就是负责把光信号与电信号的互相转换,同时提供光源。所以这种设备同时具备光口与电口两种端口。
如果是模块化的光电转换器都是支持热插拔的,不需要断电后再装卸模块。
光口跟电口分别有指示灯来指示对应的链路状态,亮表示链路通畅。
电口的连接线就是五类线,光口的连接线是光跳线
光跳线特别要注意的地方是不能拉跟折,这些线是很脆弱的,里面的玻璃丝非常细,外力是很容易折断的。所以在使用的时候要轻拿轻放。
光纤的连接线一般是成对出现的,如果两跟线插反了会不会损坏设备呢?怎么判断正反呢?光跳线插反了是不会损坏设备的,那么怎么判断正反呢,如果反了,光链路指示灯是不会亮的。那么如果不知道哪个灯是光链路指示灯怎么办呢?人为把跳线对调下,或者拔出跳线,哪个灯灭了,哪个灯就是光链路指示灯。
光电的故障有可能是光口故障也可能是电口故障,在处理的过程中可以通过看灯的闪烁或者通过另一台设备的对比来判断故障点。光电易出故障有:1、光口或者电口不亮;2、不能传输数据;3、丢包;4、特殊数据包无法通过。在处理此类故障的时候最好能有一台确定是好的光电来做比较,当然能使用笔记本测试下数据是最好的。

2、交换机
交换机的功能就是负责数据的交换与传输。根据性能的不同可以分为二层交换机、三层交换机与多层交换机,在二层交换机里面也有可网管与不可网管的区分。这里只讨论不可网管的二层交换机。(以下所说的交换机均指不可网管二层交换机)
交换机是处在OSI七层模型的第二层,是可以识别MAC地址的。这是交换机与HUB的最大区别。既然能够识别MAC地址,那么交换机的数据传输就可以做到点对点的传输。一台100M的交换机接10个用户,是不是每个用户分到10M带宽呢?不是的,每个用户都是100M的速率。用户互相之间是没有影响的。通过下面的图示来认识一下交换机的外观。

3、线路(光路和电路)
线路故障要分光路与电路。如果是光路故障,一般表现出来是光电的光链路指示灯不亮,或者光链路能建立,但是数据不能传输。在判断的过程中最好能有2个人,分别在机房与楼道,通过更换光电跟调换两根尾纤的顺序来判断两条光路是否正常。举个例子,如果怀疑光纤问题,可以一芯一芯来测试,先把一芯插在其中一个光电的TX口(发送口),另一边把纤插在光电RX口(接收口),如果不能亮就更换另一芯,如果亮了,证明这芯的光路是通的。以此类推,把2芯光路全部测出来。所以在没有红光源的情况下也是可以找对光路的。还有个小的技巧,比如在楼道用笔记本测试发现678,更换光电也没有效果,那么我们就把光电还原回去,开始怀疑是机房光电问题,这个时候如果机房光电没有标明,我们怎么去找相对应的光电呢?这个时候我们可以把楼道的光电上两芯对调,这样光路就断了,然后去机房,找哪个光电的光路指示灯是灭的,找到后把两芯对调,如果能亮证明就是这个光电跟刚才的楼道相对应。
如果是电路故障,一般就是指楼道间级联线故障,可能原因有:1、两个楼道间级联线不对应,根本不是同一根线;2、线的衰减过大,导致链路起不来,或者有信号干扰;3、其中有断线;4、中间有模块没有连接好。这个时候一般就要用到测线仪。在使用测线仪的时候一定要注意,看发送端是不准确的,一定要查看接收端。

问题:1、在已知机房与楼道相对应的2芯光纤,如何判断这两芯如何对应的?
2、光电在2单元,2单元2个用户,3单元2个用户,2-3单元间2根8芯级联线,问交换机放在2单元或3单元,分别如何接线?

总结:在处理用户故障的时候,一定要有思路,然后再想解决办法,最后再来实施。而不能测到哪是哪或者设备换到哪是哪。
一般步骤:
1、先要确定故障范围,是单个用户还是整合楼道还是整个小区;
2、确定范围后判断是硬件问题还是软件问题;
3、如果是硬件问题开始由近及远检测设备;
4、如果是软件问题通过工具软件或者笔记本帮忙判断解决问题;
5、定位了故障后,排除故障,并回到出发点检验故障是否排除。

问题:路由器左边接口192.168.1.1/24,右边接口10.1.1.1/24,A能访问B、C,但是不能访问D,如何检查故障?
如何在BIOS里将硬盘模式设置成兼容模式
接好SATA硬盘后,开机,按Del键进入CMOS设置界面;
按键盘上的TAB键和方向键,进入integrated peripherals 设置界面;
按方向键,选择Onchip IDE Device ,按回车,进入Onchip IDE Divice设置界面;
按方向键,选择SATA -Mode ,按回车,选择 IDE (如果要组件Raid,则选择Raid)
按键盘上的F10键保存并退出CMOS,在退出界面,Y 提示符状态下,回车(如果是N提示符,输入Y)。
重启电脑,这时的SATA硬盘就跟IDE硬盘一样被windows正常识别了!
安装好操作系统后,再安装SATA驱动,再次重启,进入CMOS,把SATA Mode 设置为AHCI 模式。
注:
有些主板上,在 Onchip PCI Device界面进行设置,相应的设置选项可能是 Serial ATA Mode ;
同主板进入CMOS的方式不尽相同,有的是按Tab键进入,有的是按F2键进入,等等。
许多主板启动后,出现主板LOGO或者电脑厂商的LOGO,屏幕下边有提示,按哪个键进入setup界面,这时,按那个键就可以进入CMOS。

  • 7
    点赞
  • 101
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值