专注于操作系统、网络、存储、安全、大数据与云计算、集群、基础组件等

理想很美好,现实很残酷,坚持在路上,只因初心仍存

企业网络运维中常见问题及排障!

对于网络工程师来说,在工作中听到最多的就是“网络怎么这么慢”,这种描述模糊的问题后面往往牵扯了众多的因素,病毒、环路、广播风暴、ddos攻击、设备老化,甚至线路松动,都有可能造成网络慢,面对这样的问题我们往往无从下手。

    网络故障往往由于牵扯的范围广,用户反映不准确,判断起来缺少头绪,虽有很多工具,在出问题的时候却不知道该如何利用。在此总结一些常见问题及排障思路,帮助大家梳理网络中可能出现的问题,整理处理问题的思路,学会利用工具来帮助我们判断网络故障。

    这些思路有的看起来似乎十分简单、人人都知道,但在实际工作中条分缕析、面面俱到、一一落到实处,并不是件容易事。

企业网络运维常见问题及排障思路

一、交换机刚加电时网络无法通信

【故障现象】

交换机刚刚开启的时候无法连接至其他网络,需要等待一段时间才可以。另外,需要使用一段时间之后,访问其他计算机的速度才快,如果有一段时间不使用网络,再访问的时候速度又会慢下来。

【故障分析】

由于这台交换机是一台可网管交换机,为了避免网络中存在拓扑环,从而导致网络瘫痪,可网管交换机在默认情况下都启用生成树协议。这样即使网络中存在环路,也会只保留一条路径,而自动切断其他链路。所以,当交换机在加电启动的时候,各端口需要依次进入监听、学习和转发状态,这个过程大约需要3~5分钟时间。

如果需要迅速启动交换机,可以在直接连接到计算机的端口上启动“PortFast”,使得该端口立即并且永久转换至转发状态,这样设备可以立即连接到网络,避免端口由监听和学习状态向转发状态过渡而必须的等待时间。

【故障解决】

如果需要在交换机加电之后迅速实现数据转发,可以禁用扩展树协议,或者将端口设置为PortFast模式。不过需要注意的是,这两种方法虽然省略了端口检测过程,但是一旦网络设备之间产生拓扑环,将导致网络通信瘫痪。

二、 5口交换机只能用4口

【故障现象】

办公室中有4台计算机,但是只有一个信息插座,于是配置了一台5口(其中一口为UpLink端口)交换机。原以为4台计算机刚好与4个接口连接,1个UpLink端口用于连接到局域网,但是接入到网络之后,与UpLink端口相邻的1号口无法正常使用。

【故障分析】

UpLink端口不能被看作是一个单独的端口,这是因为它与相邻端口其实就是一个端口,只是适用的连接对象不同而已。借助UpLink端口,集线设备可以使用直通线连接至另外一个集线设备的普通端口,这样就不必使用交叉线。

交换机和集线器的芯片通常为×4,所以集线设备端口大多为4口、8口、16口、24口等,如果制作成5口,就会浪费3个模块,从而增加成本。

【故障解决】

将4口交换机更换为8口交换机,即可解决故障。

三、COL指示灯长亮或不断闪烁

【故障现象】

局域网中计算机通过集线器访问服务器,但是某日发现所有客户端计算机无法与服务器进行连接,客户机之间Ping也时断时续。检查集线器发现“COL”指示灯长亮或不断闪烁。

【故障分析】

“COL”指示灯用于指示网络中的碰撞和冲突情况。“COL”灯不停闪烁,表明冲突发生;“COL”灯长亮则表示有大量冲突发生。导致冲突大量发生的原因可能是集线器故障,也可能是网卡故障。一般情况下,网卡出现故障的可能性比较小,因此将重点放在对集线器的排除方面。

【故障解决】

更换集线器,网络恢复正常。

四、升至千兆网后服务器连接不稳

【故障现象】

原先服务器采用10/100Mbit/s网卡,运行一切正常。但是安装了一款1000Mbit/s网卡,用其连接至中心交换机的1000Base-T端口之后,服务器与网络的连接时断时续,连接极不稳定,无法提供正常的网络服务。使用网线测试仪测试网络,发现双绞线链路的连通性没有问题。

【故障分析】

在100Mbit/s时连接正常,只是在升级到1000Mbit/s时才发生故障,看来导致这种故障的原因可能是超五类布线问题。虽然从理论上说超五类系统支持1000Mbit/s的传输速率,但是如果双绞线、配线架、网线和其他网络设备的品质不是很好,或者端接工艺有问题,就仍然无法实现1000Mbit/s带宽。

由于1000Base-T需要使用双绞线全部的4对线,每对线的有效传输速率为250Mbit/s,并完成全双工传输,因此1000Base-T对双绞线的信号衰弱减、回波、返回耗损、串音和抗电磁干扰等电气性能有了更高的要求。如果双绞线或者其他配件的性能不好,就会在线对间产生严重串扰,从而导致通信失败。

【故障解决】

考虑到五类布线系统的性能有可能无法满足千兆网络系统,因此更换为六类布线产品之后故障解决。

五、 Link灯不停闪动但网速奇慢

【故障现象】

服务器上网速度很慢,开始时打开网页非常缓慢,后来甚至连网页都无法打开,Ping网站也无法解析地址。 起初以为是DNS设置或者服务器故障,但是这些都正常运行。尝试Ping其他计算机,发现丢包率很高。而此时交换机的Link指示灯不停闪烁,数据的交换非常频繁,说明计算机在不停地发送和接受数据包。关闭交换机之后再重新打开,故障现象得到缓解,但是一段时间之后又出现这种故障。

【故障分析】

从故障现象来看,这是网络内的广播风暴。广播风暴的产生会有很多种原因,比如蠕虫病毒、交换机端口故障、网卡故障、链路冗余而没有启用生成树协议、网线线序错误或者受到干扰等。在网络故障发生的时候查看交换机指示灯是一个很便捷的判断方法,可以直观查看网络连通性和网络流量。

【故障解决】

就目前情况来看,蠕虫病毒是造成网络瘫痪的最主要原因。及时为服务器更新系统补丁,并且安装网络版本的病毒查杀软件,及时为服务器升级病毒库,在服务器安装防病毒客户端程序之后,故障得以解决。

六、 IP地址冲突

【故障现象】

最近我的计算机经常出现下面这种情况,提示“系统检测到IP地址xxx.xxx.xxx.xxx和网络硬件地址00 05 3B 0C 12 B7发生地址冲突。此系统的网络操作可能会突然中断”,然后就掉线一分钟左右又恢复网络连接。这是什么原因,该如何解决?

【故障分析】

这种系统提示是典型的IP地址冲突,也就是该计算机采用的IP地址与同一网络中另一台计算机的IP地址完全相同,从而导致通信失败。与该计算机发生冲突的网卡的MAC地址是“00 05 3B 0C 12 B7”。通常情况下,IP地址冲突是由于网络管理员IP地址分配不当,或其他用户私自乱设置IP地址所造成的。

【故障解决】

由于网卡的MAC地址具有唯一性,因此可以请网管借助于MAC地址查找到与你发生冲突的计算机,并修改IP地址。使用“IPCONFIG /ALL”命令,即可查看计算机的IP地址与MAC地址。最后使用“ARP –S IP地址 网卡物理地址”的命令,将此合法IP地址与你的网卡MAC地址进行绑定即可。

七、如何优化企业网络?

 1、完善的visio架构图,整体网络架构一目了然,方便全局分析;

  2、准确和详细的网络点表和IP地址规划;

 3、直观的网络设备和流量监控机制及邮件通知机制,方便快速知悉和定位网络问题;

 4、根据机房规模大小,做好机房设备按部署分区;

 5、上网行为管理用于出入口流量整形和上网行为审计;

 6、企业网络核心设备务必冗余;

 7、网络设备最好开启端口安全机制,可预防一些已知问题

点赞

发表评论

电子邮件地址不会被公开。 必填项已用*标注