从亚马逊云服务故障中吸取的七个教训

帮
助
中
心

网站公告

新闻动态

域名注册

虚拟主机

企业邮箱

数据库

云服务器

备案指南

云服务器安全

首页 » 帮助中心 » 云服务器 » 云服务器安全

从亚马逊云服务故障中吸取的七个教训

发布日期：2016-2-20 16:2:35

　　亚马逊云服务故障引发了人们对云计算的担忧，快四天了，依然没有完全恢复。那么我们能从中吸取哪些教训呢?

　　1、缺乏透明性是亚马逊的“软肋”

　　很多受到影响的顾客都抱怨在故障期间亚马逊没有提供足够的有用信息。BigDoor CEO Keith Smith 说“若亚马逊能预料到他们目前遭遇的故障的话，我们即可很快恢复我们的系统了”。GoodData 的 Roman Stanek 则呼吁亚马逊推倒神秘的围墙：

　　我们的开发运营人员不知道如何管理系统的性能、可扩展性、以及最重要的应急恢复能力。“合理的”服务水平协议和“99.999%承诺”之间的区别就是临时抱佛脚和完全符合我们各自运营流程之间的区别……在云设施中，IaaS，PaaS，SaaS和顾客之间不应该有沟通围墙。

　　亚马逊在未来几周内的挑战就是如何提供用户所需信息，增强自己的恢复能力。如果亚马逊无法满足这种需求，而且其它公司做得更好的话，它或许会渐渐失去今天在Iaas领域的统治地位。

　　2、认真阅读云服务提供商(如阿里云)的服务水平协议

　　令人叫绝的是近乎四天的故障并没有违反亚马逊的EC2服务水平协议(SLA)，FAQ部分写着“在一个区域内一年以内保证99.95%的可用性”。而这次发生故障的是EBS和RDS服务，而不是EC2，所有故障都发生在单独区域，从法律角度讲该协议没有问题。这一点值得思考。

　　3、除了云服务提供商的恢复能力之外，还有很多补救措施

　　正如来自O’Reilly的 George Reese 指出，如果你的系统在本周的亚马逊云服务故障中挂彩的话，那不是亚马逊的错误。或你把这种故障看作是可接受的风险，或你没能按照亚马逊云计算模式进行设计。查看亚马逊顾客使用的技术、避免故障非常有用。

　　Twilio和NetFlix在此次故障中安然无恙，前者是因为根据亚马逊的技术规范进行了出色的设计，后者虽然把所有的基础设施都托管在亚马逊云服务中，但通过使用多个数据中心的服务来确保服务的可靠性。

　　4、大部分顾客仍会原谅亚马逊的失败

　　不管所受影响多么严重，人们一直在赞美亚马逊，因为亚马逊帮助他们用低廉的成本和少量的投入运营者强大的基础设施。很多人在批评的同时也会给予褒奖，比如 BigDoor表示：“AWS帮助我们以极低的成本快速升级一个负责的系统。在任何时候我们都有运转良好的12台数据库服务器，45台应用服务器，6台静态服务器和6台分析服务器。如果流量或处理能力超了我们的系统会自动升级，如果不需要就会自动降级，从而节省费用。”

　　5、权衡好利弊关系可以帮助你提出问题

　　在选择一家云服务(如阿里云)之前要提出一些问题，从而判断该服务是不是靠谱。

　　比如你可以问这样的问题：你们会通过关闭某些基础设施来检测你们的自动备份能力吗?当然，你最好能亲眼看到类似测试。

　　6、增加额外的恢复能力需要更高成本

　　聪明的用户和Paas服务商应该准备多套方案。无论如何你都应该备份到亚马逊S3存储服务上，这样一旦出现问题，你可以从S3中恢复。

　　7、别认为服务商的保障可以做到万无一失

　　很多受影响用户向亚马逊支付额外费用把自己的服务托管在多个可用区(Availability Zone)。亚马逊实际上也推荐这种做法。亚马逊称每个可用区都独立运转，有独立的基础设施，非常可靠。一个可用区的发电机或冷却系统出现问题不会影响其它数据中心。此外，这些区域之间有物理隔绝，即便遇到、龙卷风、洪水等自然灾害也只会影响一个可用区。不幸的是这只是一种技术指标，并没有包括在合同条款。亚马逊消除此次事件的负面影响还需要一段时间。

　　做到事后诸葛亮不难，但亚马逊面对这种故障时的脆弱或许本可以通过深入的尽职演练加以避免。正如亚马逊竞争对手Joyent的首席科学家 Jason Hoffman 所言：“这次不是速度变慢，不是云计算失败，也不是成长的烦恼，这是亚马逊的基础框架决策导致的可预见后果。”

上一条: 亚马逊服务器宕机背后：云计算依然安全吗？

下一条: 云震 -- 亚马逊4.21事故的反思

相关问题		热门问题
Docker在云容器技术领衔 Flocker 0.3.1 新特性 Apache Flume 1.5.2 发布发展中的 Docker 技术 OpenStack私有云DR的益处 Seafile 3.1.11 发布 Docker1.3改动简介 Seafile Client 3.1.10 发... 语音输入四强争霸 Apache Libcloud 0.16.0 ...		Windows Server 2012 防火墙... Linux下l2tp客户端xl2tpd安装配置... 阿里云ECS关于跨服务器快照/镜像的使用说明 Linux系统下测试UDP端口是否正常监听的办... 阿里云ECS通过安全组屏蔽/拦截/阻断特定IP... 如何解决ECS Windows提示显示设置无法... 如何解决ECS服务器误开启了防火墙导致远程连接... 阿里云数据库安全阿里云ECS通过安全组实现将不同账号同地域云服... ECS云服务器的自定义镜像FAQ

新手上路		支付方式	快速通道		服务与支持
域名常见问题	主机常见问题	在线支付	域名信息查询	备案信息查询	帮助中心
邮箱常见问题	云服务器问题	线下汇款	域名控制面板	主机控制面板	网络违法举报
数据库问题	备案问题		万网代备案系统		互联网不良信息举报

业务QQ： 11611616 673768899 673768855		联系电话： 023-61066666 66887777 89082222
离线联系： 13452888882 13452888883 13452888886		备案专线： 023-60887777 备案专员QQ：673768866
联系地址：重庆市九龙坡区石桥铺一城精英国际40层17号 Copyright © 重庆典名科技有限公司 023dns.com All Rights Reserved