专业支持:(0512) 63016160 / 销售热线:(0512)63016068
当前在线: 288 今日上线: 1384 今日新增: 3

亚马逊宕机事件启示我们 云计算伤不起

文章来源:  锋云网 发布时间: 2011年04月24日   浏览: 1337   作者:锋云网

  由于亚马逊在弗吉尼亚州(Virginia)北部的云计算中心宕机,包括回答服务Quora、新闻服务Reddit、Hootsuite和位置跟踪服务FourSquare在内的一些网站受到了影响。这些网站都依靠亚马逊的这个云计算中心提供服务。

  亚马逊服务页面显示Virginia北部的数据中心中断。具体如下:

  问题似乎从太平洋时间21日1:41开始:我们正在调查由于ESB卷引起的延时和错误,以及US-EAST-1区地EC2实例连接失效问题。最晚的一条更新出现在早上6:09:EBS的API错误和卷延迟在受影响的区域任然存在。我们正在继续寻找解决办法。

  这次事件可以说是Amazon史上最严重的宕机事件。

  亚马逊没有表示它将在什么时候修复这个故障的具体时间。北弗吉尼亚州云计算中心是亚马逊经营的许多云计算中心之一。不过,这些系统的设计通常是一个中心宕机不会中断其它的云计算中心,也不会影响使用那个服务的用户。亚马逊没有解释它为什么没有绕过北弗吉尼亚州云计算中心的故障把工作量转移到许多其它的云计算中心。


亚马逊拥有4个不同区域的不同数据中心提供云服务

  截止4月22日,由于技术原因导致亚马逊计算服务中断事故已经持续了两天,业界分析师表示这次事故将会导致许多公司重新斟酌对远程的、没有控制权的计算机的依赖程度。

  “这是给云计算提了一个醒”,IDC的分析师Matthew Wastwood表示,云计算是指通过因特网来访问位于远程大型数据中心的服务和信息,这些服务和信息是位于不确定的任何位置,就好像是位于云中。“它将引发业界对云计算的重新思考。

  他说,这场思考将很可能会聚焦于什么数据和计算操作应该放到云上,什么是需要放在公司的防火墙内的。

  Eastwood认为,这次事件还将会导致重新审查自己的云服务契约是否合适——是否需要实现备份和恢复服务,包括为不同位置的数据中心支付额外的费用。这是为什么呢?分析师表示,很明显,在本次实践中受打击最大的是一些创业公司,他们为了追求快速发展,没有选择昂贵的备份和容灾服务,从而导致数据不可恢复。

  Amazon五年前创建了它的副业务:通过网络为企业提供数据中心先进的计算资源。今天这家公司成为飞速增长的云计算业务的早期领导者。

  在企业当中,云计算模型快速流行起来,因为它能够让企业把计算工作外包出去,从而避免了成本问题和令人头疼的数据中心运维——只需按需使用,通过网络来获取计算机处理器和存储,而不用去拥有自己的机器或这是操作软件。

  亚马逊有成千上万个企业客户,包括Pfizer和Netflix等,也有大量的创业公司,它们的业务经通常依赖于AWS。收到本次事件影响的包括Foursquare,一个本地社交网站Quora,一个问题和答案服务Reddit,一个新闻分享网站和BogDoor,一个专门为网络出版商做游戏工具的公司。

  这些公司所报告的问题不尽相同,但是都包括了不能访问数据、服务中断和网站宕机等。

  分析师说,一些已经选择了在Amazon计算机上进行关键操作大公司,倾向于选择付与计算实例同样的钱。视频网站Netfix已经成为Amazon云的大客户,其网站技术的大多数——用户电影队列、搜素工具和喜好等都运行在Amazon数据中心。

  Netfix表示平安渡过此次事件,“那是因为Netfix能够充分利用AWS的冗余云架构”,这防止了任何位置的技术故障,Nstflix的发言人Steve Swasey表示。

  BigDoor是位于西雅图的一个20人左右的创业公司,因为Amazon的失误而受到打击。它有着Amazon的备份和恢复服务,该公司的CEOKeith Smith表示,但是仅限于Amazon位于Virginia的数据中心。“总有要有一个权衡”,Smith说,注意到费用和开发者的时间将被要求来做更多的事情。

  直到星期五早上,BigDoor的大部分用于支撑游戏和奖励功能的在线出版商的服务已经备份,但是站点任然不可用。

  IDC预测,云计算将会以25%d的年增长率增长,到2014年将会到达555亿美元。主要技术供应商积极推出不同的云产品——一些强调公用模式的服务,如Amazon,还有一些更集中于向企业出售硬件和软件,以帮助企业实现海量计算工作负载的高效性。后面一种情况,企业除了使用云计算,还必须拥有这些基础架构,因此称为私有云。

  Rackspace公司的首席战略官和数据中心服务专家Lew Moorman说,亚马逊的中断事故跟坠机差不多,属于普遍事故中的一种。他指出,然而,飞机旅游比开车旅游还是安全一些的——就好比云计算比公司私有的数据中心要安全。“从世界范围内来看,每天,公司内部都会出现宕机事件。”Moorman表示,“每一段时间都很小,但是他们加起来就是更长的中断时间、金钱损失以及业务损失”。

  Amazon的挫折将给我们一些很值得借鉴的经验,“我们都有兴趣看到亚马逊处理好这件事情的方法,”Moorman表示,Moorman所在的公司Rachapace在云计算领域是亚马逊的竞争对手。

  业内分析人士表示,该事件将促使许多公司重新考虑是否将他们的IT资源移植到那些他们无法控制的云计算数据中心。

  研究公司IDC的分析师马太?伊斯特伍德(Matthew Eastwood)指出,该事件实际上是再一次敲响了云计算技术乃至整个产业的警钟,它将迫使云计算行业重新考虑这项远程控制技术所面临的问题。

  业界应该弄明白哪些资源需要部署在以数据和计算机操作为中心的数据中心,哪些资源必须运行在企业自己的IT基础设施上。

  分析人士指出,云计算的服务合同也必须重新考量,这些服务合同说明了用户需要支付多少资金用于备份和恢复服务,包括为部分处在不同地理位置的数据中心支付额外的费用。受此次事故影响最深的是部分创业公司,这些公司以追求业务的快速增长为目的,为广泛的备份和恢复服务支付费用的意愿较弱。

  在商业领域,云模型正迅速成长为一种主要的IT经营模式,不少公司正迫于将他们的计算基础设施外包给数据中心,以避免琐事并降低运营成本。目前,包括辉瑞和 Netflix在内的数千家企业都是亚马逊云的客户。已报道的受此事故影响的公司还包括基于位置的社交网站FoureSquare, 问题和解答服务商Quora 新闻共享网站Reddit 以及为网络出版商提供游戏工具的BigDoor。

  该事件将对云计算产业造成的长期影响目前尚不确定。迄今,企业云计算预计将迅速增长,逐年增速将超过25%,据IDC估计,到2014年,市场规模有望达555亿美元。

  主要技术供应商都在积极推动不同的云产品,一些厂商强调实用型的云服务,如亚马逊和其他向大公司销售硬件和软件的公司,他们可以更有效地比调节计算负荷。后者使用云技术,但这些公司拥有和控制被称为私有云的计算资源。

  不过,也有观察人士指出,云计算模式仍然是安全的。Rackspace公司的首席战略官卢穆尔曼表示,亚马逊数据中心服务中断事故对云计算行业造成的影响相当于一次航空事故,目前航空旅行仍被视为比汽车行驶更安全的交通方式。数据中心依旧比那些拥有自己IT基础设施的个别公司更安全。关键的是,业界应该从亚马逊服务中断事故中汲取教训。


标签: 计算 , 事件 , 启示 , 我们
一键分享:

在线客服