网络故障诊断及解决的一般步骤|网络故障诊断及排查方法

时间:2019-08-03 资讯 点击:

  [摘要]介绍网络故障诊断的基本概念,分析网络分层诊断技术,及实施对网络连通性故障的排除操作。   [关键词]网络 故障诊断 分层排查
  中图分类号:TP3 文献标识码:A 文章编号:1671-7597(2008)0520016-01
  
  当网络遭遇故障时,最困难的不是修复网络故障本身,而是如何迅速地查出故障所在,并确定发生原因。网络诊断是管好用好网络,使网络发挥最大作用的重要技术之一。为此,本文就网络故障诊断的概念、网络分层诊断技术及分析排查的方法进行简要的介绍。
  
  一、网络故障诊断简介
  
  网络故障诊断以网络原理、网络配置和网络运行的知识为基础,从故障现象出发,以网络诊断工具为手段获取诊断信息,确定网络故障点,查找根源,排除故障,恢复网络正常运行。必须实现三方面的目的:确定网络故障点,恢复网络正常运行;发现网络规划和配置中不足之处,改善优化网络性能;观察网络运行状况,及时预测网络通信质量(转 载于:wwW.bjYld.com 月亮 岛教育网: 网络故障诊断及解决的一般步骤|网络故障诊断及排查方法)。
  网络故障通常有下面几种可能:物理设备相互连接失败或者硬件及线路本身的问题;网络设备的接口配置问题;网络协议配置或操作错误;设备性能或通信拥塞问题;CISCOIOS或网络应用程序错误等。
  网络诊断可以使用包括局域网或广域网分析仪在内的多种工具:路由器诊断命令;网络管理工具和其它故障诊断工具。查看路由表,是解决网络故障开始的基础(转载于 :wWw.BjylD.com 月亮 岛教育网: 网络故障诊断及解决的一般步骤|网络故障诊断及排查方法)。ICMP的ping、trace命令和Cisco的show命令、debug命令是获取故障诊断有用信息的网络工具。我们通常使用一个或多个命令收集相应的信息,在给定情况下,确定使用什么命令获取所需要的信息。比如,通过IP协议来测定设备是否可达到通常使用ping命令。ping从源点向目标发出ICMP信息包,如果成功的话,返回的ping信息包就证实从源点到目标之间所有物理层、数据链路层和网络层的功能运行正常。如何在网络运行后了解它的信息,了解网络是否正常运行,监视和了解网络在正常条件下运行细节,了解出现故障的情况。利用showinterface命令可以非常容易地获得待检查的每个接口的信息。Showproc命令和showprocmem命令可用于跟踪处理器和内存的使用情况。
  网络故障是以某种症状表现出来,包括一般性的(象用户不能接入某个服务器)和较特殊的(如路由器不在路由表中)。常见排障思路如下:第一步,识别并描述故障现象,当分析网络故障时,首先要清楚故障现象。应该详细说明故障的症侯和潜在的原因。为此,要确定故障的具体现象,然后确定造成这种故障现象的原因的类型。例如,主机不响应客户请求服务。可能的故障原因是主机配置问题、接口卡故障或路由器配置命令丢失等;第二步,收集需要的用于帮助隔离可能故障原因的信息。向用户、网络管理员、管理者和其他关键人物提一些和故障有关的问题。广泛的从网络管理系统、协议分析跟踪、路由器诊断命令的输出报告或软件说明书中收集有用的信息;第三步,根据收集到的情况考虑可能的故障原因。可以根据有关情况排除某些故障原因。例如,根据某些资料可以排除硬件故障,把注意力放软件原因上。应该设法减少可能的故障原因,便于尽快的策划出有效的故障诊断计划;第四步,根据最后的可能的故障原因,建立一个诊断计划。开始仅用一个最可能的故障原因进行诊断活动,这样可以容易恢复到故障的原始状态。如果一次同时考虑一个以上的故障原因,试图返回故障原始状态就困难的多了;第五步,执行诊断计划,认真做好每一步测试和观察,直到故障症状消失;第六步,每改变一个参数都要确认其结果。分析结果确定问题是否解决,如果没有解决,继续下去,直到解决。
  
  二、网络故障分层诊断技术
  
  为了降低设计的复杂性,增强通用性和兼容性,计算机网络都设计成层次结构。这种分层体系使多种不同硬件系统和软件系统能够方便地连接到网络。管理员在分析和排查网络故障时,应充分利用网络这种分层的特点,快速准确地定位并排除故障。由于OSI各层相对独立,按层排查能够有效地发现和隔离故障,因此一般使用逐层分析和排查的方法。通常有两种逐层排查方式:一种是从低层开始排查,适用于物理网络不够成熟稳定的情况;另一种是从高层开始排查,适用于物理网络相对成熟稳定的情况。而在实际应用中往往采用折衷的方式,例如:凡是涉及到网络通信的应用出了问题,直接从位于中间的网络层开始排查,首先测试网络连通性,如果网络不能连通,再从物理层(测试线路)开始排查;如果网络能够连通,再从应用层(测试应用程序本身)开始排查。
  
  假设如图1所示的网络,这里要测试网络能否正常通信。通常从ping远程计算机开始(例中在主机A上ping主机B),成功说明系统和网络正常,失败说明主机离线或网络故障。失败后再ping同一子网的网关(例中为192.168.1.1)来确认主机A是否能够连接到路由器。失败后再ping环回地址127.0.0.1来确认TCP/IP协议软件是否有问题,如果有问题,需要重新安装TCP/IP协议软件。也可以采用另一种步骤,从ping环回地址127.0.0.1开始,失败说明TCP/IP协议软件安装有问题,如果成功再ping同一子网的网关,如果成功再ping其他网关(路由器)逐步排查网络各个环节,直到最后ping远程主机。只要成功地ping到远程主机,可以判断网络问题一般发生在更高层次。
  
  每个网络层次都有相应的检测排查工具和措施,各层的基本排查措施如图2所示。在最底层的物理层,专业人员往往采用专门的线缆测试仪,没有测试仪可通过网络设备的信号灯进行目测。数据链路层的问题不多,对于TCP/IP网络,可以使用简单的arp命令来检查MAC地址和IP地址之间的映射问题。网络层出现问题的可能性大一些,路由配置容易出现错误,可通过route命令来测试路由路径是否正确,也可使用ping命令来测试连通性。协议分析器(如微软提供的网络监视器)具有很强的检测和排查能力,能够分析链路层及其以上层次的数据通信,当然包括传输层。至于应用层,可使用应用程序本身进行测试。
  
  三、结束语
  
  网络发生故障是不可避免的。网络建成运行后,网络故障诊断是网络管理的重要技术工作。搞好网络的运行管理和故障诊断工作,提高故障诊断水平需要注意以下几方面的问题:认真学习有关网络技术理论;掌握网络的结构设计,包括网络拓朴、设备连接、系统参数设置及软件使用;了解网络正常运行状况、注意收集网络正常运行时的各种状态和报告输出参数;熟悉常用的诊断工具,准确的描述故障现象。
  
  参考文献:
  [1]《校园网系统维护与故障诊断》, 清华大学出版社, 2007-6.
  [2]《计算机网络故障诊断与排除》,清华大学出版社, 2007-4.
  
  作者简介:
  吴芳芳,女,江西上饶人,武警江西总队南昌市支队助理工程师,主要研究方向:网络通信,学士学位。

热门标签:
《网络故障诊断及解决的一般步骤|网络故障诊断及排查方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:

文档为doc格式

猜你喜欢
文章下载

《网络故障诊断及解决的一般步骤|网络故障诊断及排查方法.doc》

VIP请直接点击按钮下载本文的Word文档下载到电脑,请使用最新版的WORD和WPS软件打开,如发现文档不全可以联系客服申请处理。

文档下载
VIP免费下载文档