USTC Blog 服务8月22日晚间中断

8月22日晚间,USTC Blog 服务出现乱码、显示0个用户等问题。

此问题由 Hao Wang 在邮件列表里报告(http://archive.lug.ustc.edu.cn/2013-August/012242.html)。

bible 在第一时间修复了这个问题(http://archive.lug.ustc.edu.cn/2013-August/012244.html

boj 给出了此次故障的一些技术信息(http://archive.lug.ustc.edu.cn/2013-August/012248.html

当时 blog 服务器上没有运行特别占用资源的服务,而 freeshell 上运行了批量解析域名的脚本,resolver 是 blog,故有可能是由于 blog 上自建的 BIND9 recursor(进程名:named)占用了过多内存。之前已经设置了 BIND9 recursor 缓存限制为 512M,因此不知道是什么原因。总之,这种不熟悉的服务最好不要在生产服务器上搭建。

这次还揭露一个问题,服务器报警不够全面。早先的报警是”黑盒测试”,在 HTTP response 不包含给定字符串时触发,这次首页和我的个人博客没有明显故障,是发现不了的。因为硬盘满而出故障那次之后,还加入了磁盘报警,这是第一个”白盒测试”,不过这次没派上用场。应该再加一种白盒测试,tail -f syslog,一旦出现某些感兴趣的关键词就报警。

少院机房维护

freeshell所在机房(即少院机房)需要新安装空调。

但由于空间不够,所以需要挪动现有服务器位置,以及安装空调管道时会涉及到机房网线的挪动,

因此,不排除施工时由于人为因素使得机房内服务器暂时掉线。

施工时间:2013年8月21日早上9:00起。

涉及到的服务器有 http://ourscgy.ustc.edu.cn/tech/index.php?title=%E6%9C%8D%E5%8A%A1%E5%99%A8

由此带来的不便,敬请谅解。

 

2013/8/20

少院技术部

Freeshell 支持访问外网,修复 IPv6

首先给大家道个歉,前几天由于配置错误需要重启 freeshell 主机,所有虚拟机都重启了,有的同学正在跑的计算任务可能丢了,很抱歉。今天有了 servers.blog.ustc.edu.cn 这个平台,这种事情会在这里发布出来,欢迎 RSS 订阅。

================ 言归正传 ================

很多同学希望在 freeshell 里访问外部网络,今天我们部署了从 freeshell 访问外网的 Proxy,这下大家可以从校外的源安装非官方软件了,也可以从 github 或其他开源站点上直接下载源码了。如果你发现还是不能上外网,或者有的网站上不去,请联系我们:lug AT ustc.edu.cn。

如果你也想用 LUG 的服务器做出口加速,请猛戳这里:http://vpn.lug.ustc.edu.cn/ (LUG 会员才能申请哦)

下图是目前的网络拓扑示意图(点击看大图)

freeshell-networking

此外,由于前几天 Freeshell 重启了,IPv6 地址都不能访问了。现在 IPv6 已经恢复,如果有的同学发现还是不能用 IPv6,请重启试试,OpenVZ 对 IPv6 的支持并不是很好,我在百思不得其解之后,重启了一下自己的 freeshell,ping6 bbs6.ustc.edu.cn 就通了。如果遇到问题,请联系 lug AT ustc.edu.cn。

Update (08/19 15:30):有几个节点的 eth1 网卡没有 up 起来,因此这几个节点上的 IPv6 当时不可用。现在已经恢复。昨天由于是脚本批量执行,以为一个节点OK了其他的也没什么问题。每次想懒省事的时候,都会出问题啊……

嗯,Freeshell 是什么?你火星了:http://freeshell.ustc.edu.cn/