案例概述:
网络的复杂程度逐日增加,这使得网络故障的排查难度与日俱增,并且很多故障是瞬时突发的,故障难以复现,造成网络中遗留众多故障隐患。
利用网络回溯分析技术可以通过对网络中的数据包进行实时的保存、深入的分析,能够实时分析并回查网络中任意时段中每一个细微的异常现象,并且快速定位出现故障的网络节点,帮助用户在第一时间解决困扰他们的网络故障和安全隐患。下面我们通过科来回溯分析系统帮助用户快速解决长时间困扰的疑难故障。
案例分析:
在某集团公司的内部局域网用户,经常在凌晨访问互联网时会出现网络中断的情况,造成网络访问异常缓慢,而这时通常没有网络值守人员,很难对故障做出准确的分析和处理。该集团网络内局域网和DMZ区分别连接到防火墙,防火墙上连接互联网出口,同时中间的链路还部署如流控、负载均衡、安全审计等等多种设备,大大增加了故障排查的难度。
通过部署科来网络回溯分析系统,分别采集核心交换机流量和互联网出口流量。工作时间就可以回查问题时段的网络异常现象及原始数据包,帮助用户准确判断问题根源。
如上图所示,在发生故障时采集互联网出口流量,局域网内所有主机没有发出任何数据包,这就造成了内部主机不能正常访问互联网。但看到DMZ区的IP地址能够正常对外发送数据包,与互联网地址进行正常通讯(上图红框处),说明互联网出口连通性没有问题。
在核心交换上采集流量进行对比分析,在发生故障时,同样发现局域网主机对外发送数据包为0,不能与互联网和DMZ区进行正常通讯,说明核心交换机或核心交换机下联链路(设备)出现异常,造成外发数据包丢失。结合实际情况来看,核心交换机下联众多汇聚交换机,而这些汇聚交换机同一时间全部出现问题的几率较小,所以我们怀疑可能是核心交换机在凌晨时出现运行异常,造成短时间内不能正确转发局域网对外发送的数据包,造成网络闪断。用户更换交换机后顺利的解决的网络故障,排除了后顾之忧。
案例总结:
本次案例中故障已经发生了很长时间,但是由于故障基本发生在凌晨,工作时间很少发生并且故障时间较短,用户很难通过常规网络排查手段追溯故障时段数据,难以找到故障根源,给网络留下了故障隐患。通过科来网络回溯分析系统对比正常通讯与异常通讯可以直观的看到问题产生的根源与节点,对故障进行精确定位,快速解决了存在于用户网络中的隐患。