3 月 18 日晚 22 时 24 分,freeshell 1 号节点突然宕机,导致外部磁盘阵列服务中断。

我们尝试通过 IPMI 硬重启,重启后能 ping 通,但无法 SSH 登录,已弃疗。可能需要明天去机房修理。

首先通过 IPMI 关闭电源,过一会儿再启动,启动之后就能 SSH 了!现在各虚拟机正在启动中,今晚就能恢复服务了。
凌晨 0 时 53 分,经确认 1 号节点上的虚拟机启动完毕,于是恢复了 NFS 服务,凌晨 1 时确认各节点上的虚拟机恢复正常。

非常抱歉此问题给您带来的不便。

给管理员看的:为避免开机过程中 NFS 服务与正在启动的虚拟机发生冲突,导致内核卡死(以往 1 号节点几乎每次开机都会遇到),现关闭了 nfs-kernel-servernfs-common 服务的开机自启动。

sudo update-rc.d nfs-kernel-server disable
sudo update-rc.d nfs-common disable