一、故障检测原则

  1. 每次只做一次改动,并测试效果,如果没有达到预期效果,撤销所做更改

  2. 采取行动之前先记下当时的情况,并对每一处改动做记录

  3. 从系统或者网络的某个“端点”开始,沿着系统关键性组件开展工作。

    例如:客户机网络配置→物理连接→网络硬件→服务器物理连接→软件配置

  4. 定期沟通:用户、ISP(服务提供商)、管理员、运营商工程师

  5. 作为团队开展工作,平等合作

  6. 使用协议层处理问题,从顶部或者底部开始,对协议栈进行检查


二、TCP/IP协议层上基本工具:

  ping、traceroute、netstat、tcpdump、Ethereal、arp

  1. traceroute  www.sina.com.cn      找出IP包到达sina所经过的一系列网关

  2. netstat -a           显示TCP和UDP端口状态

  3. netstat -i/-t       显示网络接口的状态(Linux/windows)

  4. netstat -r -n        显示路由表前n条记录

  5. netstat -s          显示各种协议的运行统计信息

  6. tcpdump探测器之王:

    #tcpdump host pc1   显示与主机pc1相关的包

            -i    指定探测端口

            -n   若DNS损坏,或不希望进行名字查找,用此命令

            -v    显示包相关信息

           -vv  显示包的详细信息

            -w   把包存入一个文件

            -r    把文件读取出来

  7. Ethereal 可视化图形探测器


三、SNMP  

  1. SNMP的4种基本操作:get、get-next、set、trap(陷阱)

  2. NET-SNMP代理程序

   1、snmpdelta     一直监视snmp变量中的变化

     2、snmpdf        监视远程主机的磁盘空间

     3、snmpget       从一个代理得到一个snmp变量的值

     4、snmpgetnext   从序列中获取下一个变量

     5、snmpset       设置snmp变量

     6、snmptable     得到一个snmp变量表

     7、snmptranslate 搜索并说明MIB结构中的OID

     8、snmptrap      生成一次trap告警

     9、snmpwalk      从特定OID开始遍历MIB,默认从MIB开头开始

         例如:snmpwalk pc1(主机名) public