上周帮一家工厂排查网络延迟问题,折腾两天才发现根源是交换机配置里用了重复的主机名——一台叫 SW-MAIN-01,另一台叫 SW-MAIN-01-v2。运维同事说‘反正能连上就行’,结果SNMP监控系统直接把两台设备当成同一台,告警压根没触发。
名字不是随便起的,它得能“认得清、查得到、改得准”
在硬件维护现场,网络名称不是贴在设备上的标签纸,而是整个运维体系的索引键。命名混乱,轻则查设备要翻三张Excel表加两通电话,重则批量升级时误刷固件、ACL策略错配、甚至割接时断错链路。
我们怎么落地这套规范?
不搞虚的,就用最常碰的几类设备举例:
接入交换机:
格式:<区域代码>-<用途>-<楼层/编号>-<版本号>
例:BJ-FD-03-05-v1.2(北京分部,财务部,3楼,第5台,v1.2版配置)
防火墙:
格式:<位置>-<方向>-<序号>-<主备标识>
例:DC-OUT-01-A(数据中心出口第一台,主设备)
版本变更不改名,只更新配置文件里的 version 字段和CMDB备注。
版本号怎么标才不乱?
拒绝 v2、final、newest 这类词。统一用语义化版本:X.Y.Z
• X(主版本):硬件更换或架构级调整(如从千兆升级到万兆背板)
• Y(次版本):配置模板升级(如ACL规则集重构)
• Z(修订号):单点参数修正(如NTP服务器IP变更)
每次变更后,必须同步更新设备的 sysDescr(SNMP MIB-II字段)和登录横幅(Banner),例如:
Authorized access only. Device: BJ-FD-03-05, Ver: 1.2.3, Last updated: 2024-06-12小提醒:别把版本号写进主机名再套DNS——DNS缓存会让旧名迟迟不生效。主机名只承载定位信息,版本归属由CMDB和配置管理系统管。
有次客户用 SW-CORE-BACKUP 当备用核心交换机名,结果自动化脚本按字面匹配“BACKUP”,顺手把主设备的备份任务也删了。后来改成 SW-CORE-02-STBY(STBY=standby,固定缩写不歧义),再没出过这类事。
名字不是文档负担,是省时间的杠杆。每次改名前多花30秒想清楚结构,后面能少查2小时日志。