润迅合肥数据中心为降低网络攻击对客户造成的影响,保障准确、迅速的处理网络传输故障,特制定传输故障应急预案并于12月16日开展应急演练。
本次网络传输故障的应急演练由数据中心的IT运维经理、网络工程师和值班组成员等组成应急处理小组。10:19分演练开始,模拟故障现象,拔掉一楼接入间电信熔纤盘上的单芯光纤,中断电信网络,模拟电信接入端到楼间缆光纤故障。
演练记录如下:
10:19手动拔掉一楼接入间电信熔纤盘上的单芯光纤。
10:19 ECC监控室hostmonitor显示电信网络中断,发出告警。
10:21值班人员登陆设备查看,发现ISP-6735电信链路端口down,收光不正常。
10:22 值班人员在IT运维内部模拟在故障通报群中通报本次故障。
10:22 值班人员去核心间现场检查链路和交换机端口情况。
10:40测试发现电信端口到楼间缆之间的光纤有问题。
10:50重新布放光纤,替换有问题光纤,网络恢复正常。
11:01 值班人员在IT运维内部模拟在故障通报群中通报本次故障恢复。
最后,就本次演练做了评价结论和整改要求,后期数据中心将对机房网络拓扑组网进行系统化培训,加快提升网络检测工具使用熟练度。加强对应急故障处理方面的培训,提高发现问题、判断问题及处理问题的实际操作能力。
本次演练,有助于运维人员提高网络故障应急处理能力,一旦发生故障,确保以最快的速度恢复业务。