10月4日下午 13:26,我们到 freeshell 机房添加硬盘。

freeshell 所在的物理服务器不支持热插拔,因此每插一块硬盘,这个节点的已有硬盘就无法访问。由于部分服务器新加的硬盘是位于第一硬盘位,重启后还需要到 BIOS 里修改启动顺序才能从原有的硬盘启动。此外,一号节点有一个硬盘架的灯坏了,我们以为没有硬盘就给拔出来了,导致一号节点宕机。由于未知的内核问题,一号节点在 freeshell 初始化过程中(大约是启动后半小时)会发生 kernel panic。

添加硬盘操作已于晚饭前完成,临时关闭了一号节点的 NFS server。待一号节点的 freeshell 初始化完毕后,再打开 NFS server,就没有再发生 kernel panic,具体原因未知。现在各节点服务已经恢复,1~5 号节点的 freeshell 中断了一两个小时,非常抱歉。