网络拓扑出了问题,先别急着重启设备
公司网络突然断了,会议室视频开到一半黑屏,同事开始抱怨。你冲进机房第一反应是不是直接重启交换机?其实更靠谱的做法是——先看看网络拓扑。
网络拓扑不是画着好看的示意图,它是你排查故障的“地图”。搞不清结构,就像在陌生城市里瞎转,越查越乱。
常见的几种网络拓扑类型得心里有数
星型结构最常见,所有设备连到一个中心交换机。这里一旦主交换机出问题,整个网络就瘫了。但好处是排查简单,哪个分支断了,对应端口灯不亮基本就能锁定。
如果是环形或总线型结构,现在用得少,但老厂区、监控系统里还能见到。这种结构最怕中间某一段线路断裂,会导致后半段全部失联。
还有树形结构,层层级联,像公司总部连分部那种。问题通常出现在级联链路上,上层通,下层不通,八成是汇聚层设备或光纤模块的事。
从拓扑图入手,一步步缩小范围
手头没有拓扑图?那就先用命令抓一份出来。比如在核心交换机上执行:
show arp<br>show mac address-table<br>show cdp neighbors这些命令能帮你理清哪些设备接在哪个端口,形成实际连接关系。比对着ping结果看,哪台电脑不通,去查它上游的交换机端口状态就行。
曾经遇到过一次故障,财务部集体上不了网,其他部门正常。查拓扑发现他们共用一台接入交换机,登录一看,那个端口显示“err-disabled”,原来是有人误插了带环路的设备,触发了保护机制。
物理连接不能忽视,尤其是跳线和标签
有一次现场排查,发现路由器和交换机之间不通,但指示灯正常。一拔光纤才发现,接口松了半截,看着插着,其实没到位。这种问题在频繁插拔的机柜里太常见。
还有就是线缆没贴标签。机房里十几根网线缠在一起,根本分不清哪根通往哪里。建议平时维护时一定要标记清楚,否则故障来了光理线就得两小时。
利用工具让拓扑自动可视化
手动画图费劲,可以用些小工具。比如用PRTG或者Cacti,能自动发现设备并生成拓扑图。断网时对比前后变化,一眼就能看出断点在哪。
手机也能帮忙。拍一张机柜背面的照片,网线走向、设备型号全记录下来,下次维护直接翻相册,省得每次现看。
网络拓扑不是运维的附加题,而是基础题。结构清楚了,90%的网络故障都能快速定位。别再一头扎进设备日志里翻来翻去了,先抬头看看整体布局,往往答案就在图上。