上周三下午,某公司核心交换机配置被误删,整栋楼网络瘫痪两小时——运维小张翻出三个月前的备份文件,发现版本太老,ACL规则全对不上。这不是个例,而是很多中小企业的日常。
备份不是存个文件就完事
真正在用的备份策略,得能快速还原、验证有效、版本可追溯。下面这些步骤,我们团队在几十个客户现场反复打磨过,不讲理论,只说怎么做。
1. 明确哪些设备必须备,哪些可以缓一缓
优先保核心:出口路由器、核心交换机、防火墙、无线控制器。接入层交换机如果配置统一(比如全部走DHCP+自动下发),可批量导出后定期归档,不用每台单独备份。
2. 选对备份方式,别硬套模板
华为/华三设备常用 display current-configuration;思科用 show running-config;锐捷部分型号需先 enable 再执行。注意:有些设备开启 SSH 后默认关闭 Telnet,脚本连不上就卡住——实测中,60% 的失败源于没提前确认管理协议状态。
3. 自动化执行,但别信“一键万能”
用 Python + Paramiko 或 Ansible 都行,关键在容错。比如某次备份因设备响应慢超时,脚本直接跳过,结果当天晚上那台交换机掉线了,备份还是空的。现在我们加了重试逻辑和校验:
if len(config_text.strip()) < 500:
retry_count += 1
time.sleep(5)
continue
else:
save_to_file(device_ip, config_text)4. 备份文件命名带时间戳和设备标识
别再用“backup.txt”“config_new.zip”这种名字。我们统一格式:sw-core-hq_20240715_1423.conf(地点+设备+日期+精确到分钟)。U盘拷贝、NAS存储、甚至微信文件传输助手,都靠这个快速定位。
5. 每月抽一台设备做还原测试
不是看文件存在就行,是真进 console,startup saved-configuration xxx.conf,重启后 ping 通网关、查 ACL 生效、确认 VLAN 互通。去年有家客户备份文件里混入了调试命令 debug ip packet,一还原就占满CPU,幸好测试时发现了。
备份这件事,不拼技术多炫,拼的是哪天凌晨三点接到电话,你点开那个带时间戳的文件,心里有底。