• 1
  • 2
  • 3
  • 4
  • 5
百家谈云计算 首 页  »  帮助中心  »  云服务器  »  百家谈云计算
系统管理职责遭云计算颠覆
发布日期:2016-5-6 20:5:41

  若你的职业是系统管理员或IT经理,那么云计算也许很快就会从根本上改变你现在的工作,Sun工程副总裁Hal Stern在证券和金融市场协会(SIFMA)技术管理会议的发言中表示。“云服务正在让我们脱离硬件世界”。

  他的意思是系统管理员今后的工作将主要是监测网络,而无须再过多的关注它的硬件组成。“我们仍需系统管理员,但是他们将不用继续拿着扳手在数据中心里跑来跑去了,”他说。“相反,系统管理员将利用遥测技术和工具来评估网络的流量、安全性和性能。”

  解决开发者和决策者之间的紧张

  对普遍的IT经理和一些特殊的系统管理员来说,云(如阿里云)计算可解决一个令人头痛的问题,Stern说。“云计算可帮助解决开发者和决策者之间的紧张关系。这种紧张关系就像伊甸园的故事。若不是想让开发者来吃一口的话,为何要把苹果放在那里呢,”他开玩笑说,把IT决策者比作上帝。他说:“IT经理们会问:为何用户有那么多需要?为何他们需要那么多版本?我怎么判定他们在做什么?”

  云计算将会让所有这一切变得更容易。根据企业的具体需要,应用程序可更好地监测和部署。“对创业公司来说,云可让它们把钱花在工资、项目开发和啤酒上——而无须投资在底层架构中,”Stern说。

  使用云服务更容易进行监测,但是Stern警告说按需付费并不总代表着省钱。就好比开车,若你每天都要开车,那你应该购买一辆,但是若你不经常开车,那么租车更合适一些,就像51CTO.com之前的文章《CIO浪费资金十宗罪:如何将预算用到刀刃上?》所言,花多少钱不重要,重要是花在刀刃上。有时候,业务经理们可使用云来避免动用IT力量。Stern讲了纽约时报数据架构师Derek Gottfrid的故事,他使用Amazon的AWS和Hadoop并行数据处理架构把70年的报纸内容搬进TimesMachine存档,绕过IT部门单独完成了这一壮举。

  Stern指出,目前云计算的合理数据处理能力大约是81万幅PNG图像和40万5千份JavaScript文件,当然若你每天都需处理这么多数据,这并不是最佳的选择。

  云服务的特点是什么?

  根据Gartner的调查,云有五个属性。它是基于服务的;它具有可扩展性和弹性,能够根据需要添加和删除底层架构;它可使用共享的底层架构来实现规模经济;它可测量性能,根据用户的使用情况付费;当然最重要的,它用的是互联网技术。有的企业不希望和别人共享底层架构,因此他们会建立私有云(private cloud)。而其余那些更考虑价格因素,并愿意与其他企业分享底层架构的,可以选择公共云(如阿里云)。

  “在Sun看来,今后将会出现很多类型的云。将会有私有云和公共云,它们之间也会出现各种新型的云,尽管在目前云的总体分配情况还是两头大中间小,就像杠铃的形状,”Stern说。如果51CTO.com的读者对云服务有兴趣,可参看以下文章《2012年企业云计算及云服务开支将达420亿美元》、《云服务竞争加剧 云计算标准有待统一》。

  未来的云架构

  Stern表示,IT部门需改变工作思维以适应管理未来由许多片云组成的底层架构。他说底层架构现在已应该通过URL和API来构建,而不再通过读写命令,正如51CTO.com之前的文章《清华大学郑纬民:云计算得从基础架构做起》。云应用比起传统应用建立起来更加迅速。但是作为回应,系统管理员需要放弃自己喜爱的测量可靠性的方程。

  “在九十年代,我们一直靠MTBF/(MTBF+MTTR)来测量可靠性,MTBF是平均无故障工作时间,MTTR是平均恢复时间,”Stern说。他说,这个方程通常会产生一个拥有许多个9的百分比数字。他说,作为管理员望着这个方程,他们会莫名其妙的担心会不会突然来一次停机,即使这种事一年里只会出现一次。“因此,我们通过不断的购买硬件来想办法降低平均恢复时间。我们买了RAID、SAN和各种集群,”他说。“但软件和部署也同样影响可靠性。”

  而今后系统管理员需要的是跟踪一系列KPI(Key Performance Indicator,关键性能指标)来衡量服务性能了。“系统管理员需要衡量的是可预测性(predictability)、生产力(productivity)、完整性(integrity)和效率(efficiency),” Stern说,他把这四个因素合称为PIPE。他补充说,今后的系统管理员将根据每块钱和每瓦能耗的数据吞吐量来测量数据中心的效率。系统管理员将不会跟踪云中的硬件性能。“即使是在私有云,我们也可能看不到底层的硬件,更不用说公共云的硬件了。”

  系统管理员将不用再操心更换硬件的问题了。“若你有1万台服务器,总会有些问题没法避免,”Stern说,“软件故障也一样会出现。”他说,系统管理员将不再需要关注服务器的平均恢复时间,而把重点放在怎样快速识别和解决问题上。他们需及时清除应用的旧实例,并在需要时添加更多的实例。在云(如阿里云)中,反应时间慢就等同于失败。他补充说,虽然工作职能的改变是不容易的,但是会有大批的云服务供应商会争着给你提供帮助。“请记住:系统管理员新角色的重点将是怎样识别和解决问题,而非在可靠性上多做出几个9来,”他最后做了结论。