Freeshell 节点 5 故障说明

2014年10月19日凌晨开始,Freeshell 节点 5 发生故障无法连接。

当日上午,维护人员进入少院机房主控室进行物理接触,发现之前新添加的硬盘出现故障,导致系统被 IO 操作卡死。故障原因是硬盘连线接触不良,导致设备离线。

强制关闭机器后,新硬盘被移除。重新开机后,Freeshell 节点 5 服务恢复。

另外,查看节点 6 日志后,发现该节点新硬盘也出现了类似的错误。为了避免事故,我们将故障硬盘直接移除了。这一过程中,节点 6 的服务未受影响。

对于节点 5 上受到此次故障影响的用户,我们深表歉意。

LUG 服务器停止支持 SSL 3.0 协议

根据 Google 最新发布的 安全建议,SSL 3.0 存在 POODLE 漏洞,导致 HTTPS 安全连接可能被中间人攻击。这是一个协议设计漏洞,而非软件 bug,因此不可能通过升级软件的方式解决。

目前 LUG 使用 SSL 的 Web 站点已经禁用不安全的 SSL 3.0 协议,只支持 TLS 协议(TLSv1、TLSv1.1、TLSv1.2)。

本修改导致 IE6 用户无法使用 LUG 站点的 HTTPS 服务。事实上我们使用的 StartSSL 证书也不被 Windows XP 信任(其中包括 IE6),在此只能对 IE6 用户说声抱歉了。

Freeshell NFS 中断导致部分虚拟机关机

10月12日(昨天)14:20,各节点 NFS 中断了一分钟左右,导致部分 freeshell 停止运行。如果您的 freeshell 被关闭,请使用控制面板中的 “Start” 启动虚拟机,非常抱歉。

此外近期 freeshell NFS 出现了一些未知内核错误,导致部分新建的 freeshell 出现短时间卡住的情况,我们准备把新添加的硬盘启用起来,不再使用 NFS。

Freeshell 今天下午故障说明

10月4日下午 13:26,我们到 freeshell 机房添加硬盘。

freeshell 所在的物理服务器不支持热插拔,因此每插一块硬盘,这个节点的已有硬盘就无法访问。由于部分服务器新加的硬盘是位于第一硬盘位,重启后还需要到 BIOS 里修改启动顺序才能从原有的硬盘启动。此外,一号节点有一个硬盘架的灯坏了,我们以为没有硬盘就给拔出来了,导致一号节点宕机。由于未知的内核问题,一号节点在 freeshell 初始化过程中(大约是启动后半小时)会发生 kernel panic。

添加硬盘操作已于晚饭前完成,临时关闭了一号节点的 NFS server。待一号节点的 freeshell 初始化完毕后,再打开 NFS server,就没有再发生 kernel panic,具体原因未知。现在各节点服务已经恢复,1~5 号节点的 freeshell 中断了一两个小时,非常抱歉。

Freeshell 3 号节点外部存储异常

今天下午 16:40:56,freeshell 3 号节点的一根网线松动了,导致外部存储无法连接,运行在外部存储上的 freeshell 都被卡死了。由于 freeshell 所在的少院机房值班人员不在,暂时无法进入机房修理,非常抱歉此问题给您带来的影响。