履历贴 | 规避云服务宕机的架构设计方法
作者:凯发k8娱乐官网入口 发布时间:2022-04-13 00:01
本文摘要:本文最初揭晓于For Else网站,经原作者 Jeff Carter 许可,由 InfoQ 中文站翻译分享。前段时间,AWS履历了中断,为应对这种宕机,有许多关于架构的讨论以及它们能如何有效处置惩罚这种状况。因为这些讨论在成本、庞大性和权衡方面有很大差别,所以我想在概览层面简要先容其中的几个,然后深入先容一个在许多对话中被忽略的一种架构。多云首先,就是关于多云价值的讨论。 它的理念就是在多个云中运行你的应用。

凯发k8官网APP

本文最初揭晓于For Else网站,经原作者 Jeff Carter 许可,由 InfoQ 中文站翻译分享。前段时间,AWS履历了中断,为应对这种宕机,有许多关于架构的讨论以及它们能如何有效处置惩罚这种状况。因为这些讨论在成本、庞大性和权衡方面有很大差别,所以我想在概览层面简要先容其中的几个,然后深入先容一个在许多对话中被忽略的一种架构。多云首先,就是关于多云价值的讨论。

它的理念就是在多个云中运行你的应用。通过将负载疏散到多个供应商,我们就能在其中的某一个供应商泛起故障的时候得以幸免于难。在理论上,这种方式听起来很不错!固然,两家云厂商不会同时宕机。

可是,在实践中,由于种种原因,在应用层面这样做是很难题的:每种云的基础设施是差别的部署的庞大性会大幅度增加两者之间的带宽用度相当高昂鉴于此,多云架构并不是高可用的可行方案(少数的边缘情况除外)。多 Region接下来,是关于多 Region 的讨论。AWS Region 是由多个可用区(availability zone,AZ)组成的,每个 AZ 是一个或多个的数据中心,它们具有独立的电源、网络和毗连。

凯发k8娱乐官网入口

在一个 Region 的多个 AZ 中运行能提供高可用性,可是无法提供灾难恢复(Disaster Recovery,DR)功效。为实现这一点,我们需要多个 Region。

一个很是简略的多 Region 结构如下所示:这种方式解决了多云架构的多个问题:应用依然在同一个云中运行,所以基础设施保持稳定Region是完全独立的,因此能获得同样的可用性优势Region之间的带宽用度要比云之间的用度低得多但令人遗憾的是,大多数的评论都是围绕 Active-Active 的多 Region。也就是将负载同时漫衍到多个 Region,这带来了许多关于持久化同步方面的庞大性。同时,这种方式也会增加部署方面的庞大性,而且许多地方都很容易堕落,甚至它自己的停机时间比 AWS 导致的宕机时间可能还要长。

多 Region DR这是最近以来一种被忽视的方案。它的理念是在同一时间只有一个 Region 处于活跃状态,在发生灾难的时候,另外一个备用的 Region 能接受系统的功效(因此是 DR)。这种方式和上面所述方案的收益是一样的,可是它能极大地规避全 Active-Active 架构的庞大性。

凯发k8官网APP

在这种架构下,备用 Region 不用完全构建,只需要复制持久化数据即可。可是,稍等,在发生灾难时,部署完整的应用栈岂非不需要一段时间吗?是的,是这样的,不外这是允许的!对大多数常见的中断场景来说,高可用是通过使用多 AZ 实现的,这种方式就足够了。如果整个 Region 泛起问题,就像我们前段时间在 AWS 上所看到的那样,花费小于一个小时的时间从备份中建设一个新的应用栈,仍然要比大于八个小时的中断更可取。这个历程可以通过自动化的方式来举行简化,但即即是手动的(但经由了实践磨练)操作,有可选的备用方案也是很重要的。

所以,我们更深入地探讨一下这种架构:应用法式像平常那样部署在主Region中使用AWS托管的服务、备份和副本实现数据持久化,这通常只需要一两个设置即可:在差别的Region中为RDS添加一个读副本建立Dynamo DB global表启用S3 bucket副本在举行故障恢复的时候,将应用法式部署在其他的Region上,并更新DNS的设置这一历程要定期举行测试这是一个银弹吗?绝不是。它并不适用于任何类型的事情负载,也绝对不行能适用于任何类型的宕机。然而,它是一个相对简朴的方案,而且有一定的成本效益。

总结总之,中断肯定是会发生的,这丝绝不会降低 AWS 的价值,可是这确实讲明了良好架构和计划的重要性。我们可以设计一些很是昂贵和庞大的系统来缓解这些中断,但这对大多数客户来说是矫枉过正和不切实际的。幸运的是,我们另有一些其他的选择,它们可能会提供一个“足够有效”的解决方案,并有合理的权衡,这应该成为在 AWS 上开展事情时的“最佳实践”。

原文链接:https://www.forelse.io/posts/architectures-for-mitigating-aws-outages延伸阅读:MLOps正在改变机械学习模型的开发方式-InfoQ关注我并转发此篇文章,即可获得学习资料~若想相识更多,也可移步InfoQ官网,获取InfoQ最新资讯~。


本文关键词:履历,贴,规避,云,服务,宕机,的,架构,设计,凯发k8娱乐官网入口

本文来源:凯发k8娱乐官网入口-www.gtmosaic.com

电话
061-64878505