因为我开了邮件通知,大约今天凌晨大约一点多开始推送服务器下线的通知。

昨天给 Kanae 送饭,晚上比较累,所以没当回事儿,下午不是也断线了一小段时间。

大约持续了 1个小时37分钟,是比较久了,虽然阿里云很稳定,但是按我这么多年使用轻量的经验来看,偶尔抽风也是正常的。

结果凌晨上连着爆了两个小时,是在忍不住了,三点多爬起来去服务器一看,好家伙,变成了下线状态,我也没操作过啊,总不见得是阿里云工程师操作失误吧。

接着我就顺手点了开机,诶!没反应!然后过了一会又点了两次,还是没反应。

接着控制台显示实例,不存在,好家伙,这不得开个工单拷问一下客服了。

然后我一打开工单,当当当!重磅消息:

就我的服务器在的机房是吧!真撞大运了。

我想了想,临时把部署服务都更新也太麻烦了,不如直接且 vercel 备份节点算了,之前 也说过要是服务器下线了,就换 vercel ,随后就切了备份节点了。

虽然不知道为什么是五点多才恢复的, 但是实际上我三点半就完成了配置了。

国内的访问慢点就慢了吧,总比没有强。然后想着家里的对外服务的 frp 也都挂这上面了,把配置文件也给替换了,然后找日本的节点先顶顶了。

最后总结一下:

  1. 轻量服务器 和 云服务器一定别忘记开镜像 & 备份,我就是忘记对这个服务器开备份了,要重新部署就稍微麻烦一点,否则直接同区开一个新的就完事儿
  2. 个人能多用 serverless 服务就多用,至少 serverless 是多地容灾的,不会出现一挂全挂的情况
  3. 家用服务对外尽可能考虑切换为打洞的方案,比如 tailscale、zerotier、zero trust 这种不需要自己架服务的方案。
  4. 自己使用的服务可配置化,我修改家用的服务只需要修改一份配置文件即可
  5. 备份很重要!因为我的服务都是有离线 self host 版本的,且数据通过多个对象存储备份,所以最差情况下可以手工恢复或者切换为离线访问即可。重要数据一定要 3-2-1备份原则

附站点监测页面: https://status.iceprosurface.com/

本文标题:我的云服务器被烧了

永久链接:https://iceprosurface.com/blog/server-down/

作者授权:本文由 icepro 原创编译并授权刊载发布。

版权声明:本文使用「署名-非商业性使用-相同方式共享 4.0 国际」创作共享协议,转载或使用请遵守署名协议。

查看源码: