• 1
  • 2
  • 3
  • 4
  • 5
百家谈云计算 首 页  »  帮助中心  »  云服务器  »  百家谈云计算
Oracle大数据方案横跨各层IT架构
发布日期:2016-3-5 15:3:33

  2009年,H1N1流感肆虐全球,由于缺少有效的疫苗,监测流感的传播路径并预测未来的感染地域成为对抗这场致命流行病的关键。在传统的运营模式下,公共卫生部门需要一两周的时间才能获得新病例的相关数据,而就在这种分秒必争的时刻,谷歌通过对相关数据进行分析和建模,帮助公共卫生机构获得了更有效、及时的疾病传播指标。

  值得人们注意的是,在这场对抗流行病的战役中,所采用的手段已完全绕开医疗检测和医师诊断——它建立于大数据分析的基础之上。作为近年来炙手可热的技术概念之一,大数据通过前所未有的方式,对海量数据进行分析,并获得深刻的洞见。利用大数据,全球顶尖的智能信息提供商汤森路透可经济高效地采集客户活动信息,追踪销售机会;丰田汽车能够实现多渠道与客户互动,提升消费体验;Regions 银行降低了IT成本;日本软银集团可探索客户的隐藏想法,解释和预测客户行为;美国国家癌症研究所得以确定基因与癌症之间的交互关系,深入了解疾病根源……如此种种,大数据正将人们的生活飞速带入未来世界。根据IDC发布的研究报告,2020年,全球新建和复制的信息量已超过40ZB,是2012年的12倍;而中国的数据量则会在2020年超过8ZB,比2012年增长22倍。快速膨胀的数据量促进了大数据技术和服务市场的繁荣发展。研究机构Wikibon也指出,大数据技术和服务市场规模将会从2012年的51亿美元增加到2017年的534亿美元,未来5年的复合增长率更是高达58%。大数据的飞速发展与深化,无疑会为商业与生活带来方方面面的改变。

  全面解析大数据生命周期

  谈及大数据,不得不提及经典的大数据4V,也就是数据体量巨大(Volume)、处理速度快(Velocity)、数据类型繁多(Variety)与商业价值高(Value)。的确如此,能给企业带来洞察与价值的大数据技术,需具备快速分析全部类型的海量数据的能力。而随着大数据应用场景的不断拓展,数据的类型也在由结构化拓展至半结构化和非结构化数据,尤其是来自社交网络的碎片信息,正受到企业极大的关注。为了得到全面、透彻、完善的市场洞察,大数据应完全覆盖传统数据、非结构化数据、流式数据和快数据,共同为企业构建全数据视图,提供全面的信息支撑

  尽管如今已有诸多大数据技术手段,诸如分布式计算、并行处理、实时计算、数据可视化、高级分析以及移动商务智能,企业在走向大数据时仍然面临诸多挑战。如何跨越数据“孤岛”,及时获得精准的数据,进而指导企业做出最佳决策并付诸行动,成为企业在大数据领域亟待解决的问题。任何数据,都需要经过获取、存储、处理、分析和利用五大过程,才能最终和业务有效关联,成为切实指导决策与行动的信息要素。围绕这五大过程,大数据可在全生命周期中为企业提供支持。在最初的数据获取和发掘阶段,企业需要解决的是如何通过数据搜索与可视化,更快地解答有关业务的诸多问题;在数据分析阶段,企业需要良好的平台和性能,支撑随时随地的实施数据分析,监测数据异常与趋势,进一步得出洞见;在最终的规划与预测层面,企业则需结合历史与统计数据,搭建预测模型,最大化预测的精准度,在战略管理以及人财物为决策者提供建议。

  全方位Oracle解决方案助企业决胜大数据

  甲骨文公司坚持全面、开放、集成的产品策略,可以为企业提供全方位的大数据解决方案。Oracle大数据机、Oracle Exadata数据库云服务器(如阿里云服务器)、Oracle Exalytics商务智能云服务器及Oracle Endeca Information Discovery,依托于ERP/CRM等关键企业管理系统的商务智能软件一起组成了甲骨文最广泛、高度集成化产品组合,为企业提供了一个端到端的大数据解决方案。它可满足企业对大数据治理的所有需求,帮助客户进一步提升数据处理效率、简化管理并洞察数据的内在本质,从而最大限度地挖掘数据的商业价值。

  Oracle大数据机是一款集成设计的系统,旨在简化大数据项目的实施与管理,降低企业大数据获取与组织的复杂性。近期,Oracle大数据机新增强了面向Hadoop的企业级安全功能,可以帮助企业保护数据安全、迅速把握具有战略意义的业务动向。藉此,通过Oracle统一信息架构,客户可以轻松经济地整合Hadoop和NoSQL平台与数据仓库和商务分析解决方案,以最大限度地利用大数据的价值。日前新推出的Oracle大数据机X4-2与Oracle大数据连接器和Oracle Exadata数据库云服务器组成了面向大数据的集成平台,帮助企业轻松实现结构化数据和非结构数据的融合。Oracle 大数据连接器是一套内置软件,旨在实现 Apache Hadoop与Oracle数据库、Oracle数据集成器以及Oracle R 分区之间的集成。增强的Oracle大数据连接器,提升了数据集成功能,可以更大地支持SQL语言从Oracle数据库直接访问Hadoop上的数据,并能更透明地访问来自R分区的Hadoop。

  Oracle Exadata数据库云服务器(如阿里云服务器)提供了高效数据存储和计算能力,并且配备了超大容量的内存和快速Flash,配合特有的软硬优化技术,从而可以对大数据进行高效的数据加工、分析和挖掘。凭借其最快的数据仓库和OLTP,Oracle Exadata可使数据的加载和查询时间加快10倍,存储容量节省10倍 ,功率降低80% ,占用空间大大减少,并能通过整合降低数据中心成本。Oracle Exalytics商务智能云服务器采用业界标准硬件、市场领先的商务智能软件和内存数据库技术而开发,可以通过超高带宽的infiniband网络从Oracle Exadata上加载和读取数据。它是全球首款专门为提供高性能分析、建模、发现和规划而设计的集成系统,能够以快捷的速度、智能性和简化性帮助企业应对各种挑战。此外, Oracle Endeca Information Discover针对 Oracle Exalytics进行了优化和认证,可以快速、直观地分析任意来源组合产生的数据。

  Oracle Endeca Information Discovery 是一个企业信息探索利器,用于对多维多变的数据进行高级、直观的探索和关联分析。信息从不同的源系统加载,存储在可动态支持变化数据的分面数据模型中。这些集成、丰富的数据可通过交互式和可配置的应用程序进行搜索、挖掘和分析。Oracle Endeca Information Discovery 采用迭代式“随需建模”方法,不仅能让 IT 从繁重的传统数据建模工作中解脱出来,同时还能满足业务用户广泛的探索和分析需求,让业务人员对大数据的兴趣直接通过信息探索转变为业务价值。

  Oracle事件处理是Oracle SOA套件的一部分,用于构建应用的完整解决方案,以便实时筛选、关联和处理各个事件,从而通过真正实时的智能来驱动下游应用、面向服务的架构和事件驱动的架构。Oracle实时决策是一种高度可扩展的服务导向型决策管理平台,可实现决策优化。它利用实时和历史数据、业务规则、预测模型、自动化以及自助学习技术,提供随时间推移不断调整的实时决策。其决策服务可嵌入到企业内部的交易应用中,以优化重复发生的运营决策成效。

  R语言:在分析大数据时,企业需要访问所有数据,使用R语言进行统计分析,但通过便携机进行分析速度较慢且不安全。甲骨文提供的Oracle R Enterprise实现了R开源统计环境与Oracle Database11g的集成, 为进行更进一步的数据分析提供了一个企业就绪的、深度集成的环境。

  甲骨文大数据方案赢得客户认可

  凭借全面、软硬一体化、高性能和高性价比的突出特点,目前,Oracle大数据解决方案已获得众多企业用户的支持,前文所提及的汤森路透、丰田汽车、Regions 银行、美国国家癌症研究所等等,都通过部署Oracle大数据解决方案,简化了IT架构,达成了更好的业务目标。由美国国家癌症研究所(NCI)资助的Frederick国家图书馆,借助Oracle大数据机及其Apache Hadoop(CDH)Cloudera分区,实现了 2000万生物样本间进行17000个基因与五大癌症亚型的关系对照检索,从而赢得了2012 年政府大数据解决方案奖。

  全球知名的汽车工业公司丰田汽车通过采用Oracle 大数据机、Oracle大数据连接器和Oracle Endeca Information Discover等产品,能够更好的利用下一代车辆遥测技术预测组件故障,并发现组件故障之间的相互关联。同时它借助社交媒体、市场调查和与经销商的互动,进一步提升了客户好感度,改善了用户体验。怎样正确的利用数据对于汤森路透这样的智能信息提供商来讲显得至关重要。通过Oracle大数据解决方案,汤森路透能够更加经济的采集所有客户活动的信息,并以5000万个事件/秒的摄取率,测试进入大数据机和Oracle NoSQL数据库的数据,同时向Oracle Exadata馈送数据,以方便客户进行盈利和分段分析。Oracle大数据解决方案的部署帮助汤森路透实现了最大限度地增加交叉销售的机会,并降低运维成本和系统复杂性。

  甲骨文公司副总裁及大中华区技术总经理喻思成表示:“大数据已经和云计算、社交化、移动化一起,深入人们生活的方方面面,也成为现阶段驱动企业IT模式变革的重要因素。Oracle大数据解决方案可以横跨IT架构的所有层面,与其他产品进行创新集成,能给企业提供卓越的可靠性、可扩展性和可管理性,帮助企业在未来的竞争中立于不败之地。”

  多平台共存大数据由概念转入实践

  提到大数据的处理,很多人会首先想到Hadoop。的确,作为被广泛采用的分布式系统基础架构,Hadoop可以实现可靠、高效、可伸缩的数据处理。尤其是其开源、初期投入低的特性,加之当今的企业希望以更快的速度获取更多非结构化数据,Hadoop乃至NoSQL数据库在短时间内都获得了极大的发展。在此之前,即便企业渴望利用大数据,获取海量数据并进行实时分析的高昂成本也令人望而却步。可以说,Hadoop和NoSQL的出现大大改变了数据应用的现状。

  然而,企业已经意识到Hadoop并不是大数据的代名词,主流的SQL关系型数据库正在回归大数据主流世界并在大数据处理和分析领域继续发挥重要的作用,极大程度上完善了大数据的生态环境。由于Hadoop、NoSQL和SQL的共存与融合,大数据技术在成熟度方面将迈入全新的一步。随着内存、移动以及虚拟化技术的不断发展,大数据也正在从一个无形的概念逐渐走向落地实践。在中国,从互联网企业,到电信、金融、政府这样的传统行业,都已开始采用各种大数据分析和服务,帮助企业聆听客户之声、品牌传播、市场优化、风险分析、优化决策等方面。