ESXi更新补丁说明

2015年7月9日 更新了以下补丁

  • KB2117548
  • KB2111990
  • KB2117541
  • KB2117543
  • KB2117545
  • KB2111984
  • KB2117547
  • KB2117546
  • KB2111983

为使补丁生效,热迁移后重启了所有工作节点,未造成服务中断。

(以下内容供维护人员参考)

更新过程:

  1. 登陆vCenter,将待更新的主机上运行的虚拟机迁移到其他主机
  2. 进入维护模式
  3. 打开SSH服务
  4. 通过sftp上传补丁文件(update:可以直接存放在nfs中)
  5. SSH登陆主机,安装补丁文件(命令:esxcli software vib install -v /path/to/patch/file.vib 或者 esxcli software vib install -d /path/to/ESXi.zip)
  6. 重启主机
  7. 退出维护模式
  8. 将虚拟机迁移回来

vCenter、VDP所在主机的更新过程:

由于目前vCenter和VDP安装在本地磁盘,因此无法进行热迁移。故三号节点的更新过程略有不同。

  1. 通过VpxClient连接ESXi
  2. 关闭vCenter、VDP
  3. 进入维护模式
  4. 打开SSH服务
  5. 通过sftp上传补丁文件
  6. SSH登陆主机,安装补丁文件(命令同上)
  7. 重启主机
  8. 退出维护模式
  9. 启动vCenter、VDP

vSphere集群故障通知

为了给ESXi打补丁,执行了数据热迁移操作,但热迁移过程中似乎触发了某个vSAN的bug,导致vSAN中的部分数据丢失。

受影响的服务包括但不限于:

  • GitLab
  • 防污染DNS
  • lug主页
  • Google字体加速
  • LUG邮箱转发

我们正在从备份服务器执行恢复操作。给您带来的不便,敬请谅解。

update 7月8日 9:30:向集群添加了一块250G SSD,用于数据冗余,降低未来故障的几率。

update 7月8日 11:30:vCenter恢复。

update 7月8日 15:50:VDP恢复。

update 7月8日 17:30:集群网关恢复,其他服务陆续恢复中。

update 7月9日 00:17 :运行在集群中的全部服务均已恢复。

东图集群网关添加出国加速隧道备份功能

(以下供维护人员参考)

目前VPN服务器、blog服务器都是使用移动出口作为加速通道。但由于我校移动出口稳定性不佳,为了最大限度确保出国加速的可靠性,现使用教育网出口作为出国加速备选通道。移动隧道延迟58ms,教育网隧道延迟96ms。因此只有当所有移动隧道都跪了之后,才会选用教育网隧道。

【具体实现】

在防火墙mangle表中加入以下规则:

-A PREROUTING -j CONNMARK --restore-mark --nfmask 0xffffffff --ctmask 0xffffffff
-A PREROUTING -m mark ! --mark 0x0 -j ACCEPT
-A PREROUTING -m mark --mark 0x0 -j ExtraManglePrerouting
-A PREROUTING -m mark --mark 0x0 -j AbroadMobileManglePrerouting
-A PREROUTING -m mark --mark 0x0 -j AbroadCernetManglePrerouting
-A PREROUTING -j CONNMARK --save-mark --nfmask 0xffffffff --ctmask 0xfffffff
-A ExtraManglePrerouting -i ExtraCernet -j MARK --set-xmark 0x10/0xffffffff
-A ExtraManglePrerouting -i ExtraTelecom -j MARK --set-xmark 0x11/0xffffffff
-A ExtraManglePrerouting -i ExtraMobile -j MARK --set-xmark 0x12/0xffffffff

其中ExtraManglePrerouting的作用是让从外部发起的连接,回复的数据包走原先的接口。自定义链AbroadMobileManglePrerouting实现出国加速移动隧道的负载均衡标记,自定义链AbroadCernetManglePrerouting实现出国加速教育网隧道的负载均衡标记。这两条链均由TunnelMonitor监控并维护。