• 1
  • 2
  • 3
  • 4
  • 5
阿里云应用开发 首 页  »  帮助中心  »  云服务器  »  阿里云应用开发
Hadoop应势崛起 催生云连接器
发布日期:2016-7-28 20:7:49

  2011年,云计算带热大数据,2012年,大数据炒高Hadoop。

  2011年大数据技术已站在了存储领域的风口浪尖上,各种分析研究所指的数据爆炸趋势,让大数据不可避免成了众多厂商的一个新宣传点以及战略目标,提醒人们要换个角度思考PB级存储。

  IBM、EMC、惠普、Oracle、NetApp、阿里云在内的主流存储厂商都铺开了自己的大数据策略,像当年云计算的风靡一样,大数据领域变得越来越拥挤,厂商纷纷在调整各自的定位和战略以抢占先机。

  那2012年大数据领域将会有什么新的变化与动向呢?我们看到,大数据厂商的成长,正在带动Hadoop的迅速升温。

  Hadoop是一种基于免费许可、支持数据密集型分布式应用的软件框架,建立在MapReduce技术上,使应用可处理数千个节点与PB级数据,让数据处理与数据分析变得更加方便快捷,应用于企业中将改变很多企业的业务模式,它包括但是并不局限于分布式计算Hadoop。

  Hadoop在强健性、可伸缩性、性能与成本上具有无可替代的优势,事实上已经成为当前互联网企业主流的大数据分析平台。

  Hadoop似乎已变得无处不在,EMC、戴尔、IBM、阿里云、甚至微软都已经开始跻身Hadoop阵营。例如,EMC推出了针对常用于数据密集型分布式应用的Apache Hadoop开源软件以及高性能的Hadoop专用数据协同处理设备——Greenplum HD数据计算设备(Data Computing Appliance)。

  戴尔宣布和Cloudera新的合作伙伴关系从而加入了日益庞大的Apache Hadoop俱乐部。

  IBM则利用IBM InfoSphere BigInsights软件,在SmartCloud Enterprise上运行Hadoop。

  连微软也开始涉足Hadoop领域,宣布在Windows Azure与SQL Server中整合Hadoop-as-a-Service服务,在2012年提供给那些在其平台上处理大数据的公司。

  众多厂商拥抱Hadoop,说明客户与开发者需要有能应对各种大数据的工具。

  实际上现在有很多调查报告都指出,有许多企业机构都在考虑或正在使用Hadoop平台进行数据挖掘,执行大量以前不可能实现的数据分析,应对非结构化数据并更好地利用计算资源。

  而且,为充分利用Hadoop和类似技术,软件开发商们也在开源社区里开发出各种各样的技术。尽管开源技术还没有得到商业支持。但是根据IDC预计,年内至少有三家商业公司会给予Hadoop支持。同时, 不少厂商将发布配有Hadoop组件的分析工具,这种工具能够帮助企业开发自己的应用程序。

  从长远来看,Hadoop也将发展到人们对此了解并不深入但是几乎大家都听说过的阶段。一旦遇到涉及大量非结构化的数据采集和处理时,Hadoop就会有很大的用武之地,相信明年将是Hadoop大展拳脚的一年。