可能是由于未知的内核 bug,blog 11月6日 21:13 突然当机,症状为能 ping 通,TCP 连接能建立,但后续的包只能以很小的概率收到。syslog 里有 blocked for more than 120 seconds,mysqld、named 等进程不能正常运行,连 init 6 都不响应。jameszhang 强制重启了 blog 机器,23:04 服务恢复正常。

Update:jameszhang 说不是他重启的 blog 机器,那么 blog 应该是花了两小时时间自己重启了。21:36,auth.log 显示我 ssh 进去了,执行了 sudo init 6。22:52,rsyslog 记下最后一条日志。23:04 出现从0开始的 kernel 信息,重启正常。jameszhang 说这两个小时 blog 产生了大量流量。