因为我开了邮件通知,大约今天凌晨大约一点多开始推送服务器下线的通知。
昨天给 Kanae 送饭,晚上比较累,所以没当回事儿,下午不是也断线了一小段时间。
大约持续了 1个小时37分钟,是比较久了,虽然阿里云很稳定,但是按我这么多年使用轻量的经验来看,偶尔抽风也是正常的。
结果凌晨上连着爆了两个小时,是在忍不住了,三点多爬起来去服务器一看,好家伙,变成了下线状态,我也没操作过啊,总不见得是阿里云工程师操作失误吧。
接着我就顺手点了开机,诶!没反应!然后过了一会又点了两次,还是没反应。
接着控制台显示实例,不存在,好家伙,这不得开个工单拷问一下客服了。
然后我一打开工单,当当当!重磅消息:
就我的服务器在的机房是吧!真撞大运了。
我想了想,临时把部署服务都更新也太麻烦了,不如直接且 vercel 备份节点算了,之前 也说过要是服务器下线了,就换 vercel ,随后就切了备份节点了。
虽然不知道为什么是五点多才恢复的, 但是实际上我三点半就完成了配置了。
国内的访问慢点就慢了吧,总比没有强。然后想着家里的对外服务的 frp 也都挂这上面了,把配置文件也给替换了,然后找日本的节点先顶顶了。
最后总结一下:
- 轻量服务器 和 云服务器一定别忘记开镜像 & 备份,我就是忘记对这个服务器开备份了,要重新部署就稍微麻烦一点,否则直接同区开一个新的就完事儿
- 个人能多用 serverless 服务就多用,至少 serverless 是多地容灾的,不会出现一挂全挂的情况
- 家用服务对外尽可能考虑切换为打洞的方案,比如 tailscale、zerotier、zero trust 这种不需要自己架服务的方案。
- 自己使用的服务可配置化,我修改家用的服务只需要修改一份配置文件即可
- 备份很重要!因为我的服务都是有离线 self host 版本的,且数据通过多个对象存储备份,所以最差情况下可以手工恢复或者切换为离线访问即可。重要数据一定要 3-2-1备份原则
附站点监测页面: https://status.iceprosurface.com/
本文标题:我的云服务器被烧了
永久链接:https://iceprosurface.com/blog/server-down/
作者授权:本文由 icepro 原创编译并授权刊载发布。
版权声明:本文使用「署名-非商业性使用-相同方式共享 4.0 国际」创作共享协议,转载或使用请遵守署名协议。