9月8日 20:39,1号节点 NFS server 再次导致 kernel panic。为保证服务正常运行,现暂停外部存储的网络挂载。存储在外部存储上的 freeshell 暂时无法访问,非常抱歉。请放心此故障不会导致数据丢失。

受影响的 freeshell 列表:
2397,2410,2425,2426,2428,2431,2433,2438,2443,2445,2446,2447,2448,2449,2450,2452,2460,2461,2462,2468,2469,2470,2471,2473,2474,2475,2480,2481,2482,2483,2490,2496,2497,2499,2506,2508,2509,2512,2513

Update(21:30):现已恢复。


为避免 NFS oops 再次导致 kernel panic,现修改了 sysctl kernel.panic_on_oops = 0,即发现非严重错误(BUG 或 oops 时)只记录日志,不产生 kernel panic 挂死机器。


为避免 kernel panic 后机器一直处于宕机状态,现修改了 sysctl kernel.panic = 60,即 kernel panic 后 60 秒自动重启机器。