3月8日凌晨 5:15,LUG 在网络中心机房的电信线路开始出现异常高延迟。5:25 至 5:30,电信线路彻底中断,连校内少年班学院机器都连不上,所有 LUG 服务均受影响。但移动和教育网线路正常。6:00 至 6:15、7:00 至 7:05、8:25 至 8:30,电信线路又出现了中断。

我们发现机房内部出现了至今(16:00)未消除的异常高延迟,而且这个延迟不稳定。

3月8日6时至15时从 mirrors ping 三个默认网关的延迟(单位:毫秒,下同):

Capture

6时至7时(一个小时的时间)ping 三个默认网关的延迟:

Capture

上面这张图将 0~100 毫秒部分放大:

Capture1

7时至8时(一个小时的时间)ping 三个默认网关的延迟:

Capture2

可以发现这些延迟有一定的规律性,而且极端高延迟几乎是在三条线路同时出现,因此猜测是机房网络配置问题或者有网络攻击。

ping 原始数据下载(3月8日6时至15时,每秒一个点,单位为毫秒):

注:3月8日下午 jameszhang 回复,“06:00- 11:00 左右核心交换机(所有网关都是它)的CPU利用率持续较高,可能是这个原因引起的。”