老张在机房换完第三块坏掉的千兆网卡后,顺手重启了交换机——结果整个办公区断网二十分钟。同事问他是不是改了配置,他挠头:“没动啊,就拔插了一下。”
网络管理不是“修网线”的代名词
很多硬件维护人员一听到“网络管理”,下意识觉得那是网管的事,自己只管设备通电、风扇转、指示灯亮。但现实是:一台交换机配错VLAN,整层楼打印机连不上;路由器ACL规则写反了,监控摄像头数据传不出去;甚至UPS没接好SNMP模块,市电一停,连告警都收不到——这些全在你的责任边界里。
几个必须盯住的硬指标
不装软件、不背命令,先看三样东西:
- 端口状态:用console线连交换机,敲
show interface status(思科)或display interface brief(华为),重点看 connected 和 notconnect 后面的速率、双工模式。常见坑:自动协商失败导致半双工,一传大文件就丢包。 - MAC地址表:执行
show mac address-table,检查关键设备(比如服务器、门禁主机)的MAC是否稳定出现在对应端口。如果MAC频繁漂移,八成是环路或者网线接错。 - 日志尾巴:别等出事再翻完整日志。日常巡检就跑一句
show logging | include %LINEPROTO-5-UPDOWN|%LINK-3-UPDOWN,端口反复up/down,立刻查物理层。
物理层才是第一道防线
某次客户报修“核心交换机连不上”,到现场发现:光纤跳线弯折半径小于3厘米,光衰超标12dB;另一家单位用普通超五类线拉了90米,还穿金属桥架,POE供电的AP隔三差五掉线。这些都不是配置问题,是线材、距离、屏蔽、弯折这些“摸得着”的细节出了岔子。
建议随身带三样小东西:光纤测光笔(几十块钱)、网线通断仪(带线序检测)、便携式数字万用表(测POE电压是否稳定在48±3V)。比背十条SNMP OID管用。
别让IP地址变成“糊涂账”
很多机房贴着“192.168.1.101—服务器A”,但实际这台机器早就换成了Windows Server 2022,DHCP租约没关,IP被新笔记本抢走。结果远程桌面连过去,弹出的是陌生桌面。
最朴素的办法:维护一张纸质表格,只记四列——设备名称、品牌型号、管理IP、所在端口(如“SW2-Gi1/0/23”)。每次插拔、更换、升级,顺手划掉重写。比任何CMDB都及时可靠。
最后提醒一句:下次看到网管在后台改配置,别急着转身走。凑过去问一句“这个命令影响哪些端口?”——十次里有七次,答案会帮你省下半天排障时间。