整合企业NoSQL的要点说明
发布日期:2016-4-20 19:4:26
整合企业NoSQL的要点说明 作者:Thor Olavsrud,首席信息官,熟悉IT安全,大数据,开源技术,微软工具和服务器。现居纽约。 现如今NoSQL(非关系型数据库)可以提供灵活性、可伸缩性、执行性与可用性来支持许多应用程序,但是实现它们并不总是想象的那么容易。 数据推动企业创新和业务增长,但只为有准备的企业有效地处理数据。 虽然关系数据库有自己的一席之地,但是今天数据的复杂性,海量与需求使它们不适合一些特定的应用程序。在很多这样的情况下,NoSQL技术的加入填补了这样一个缺憾。不过,要想实现NoSQL系统进入你的企业可并不是一件简单的事。 这是非常值得做的,但是它需要仔细的规划和企业的买入,这是许多IT组织忽略的关键, Mark Logic(NoSQL的提供商)的产品执行副总裁Joe Pasqua发表看法,他认为企业NoSQL的引入拯救了Healthcare.gov (美国联邦健康保险交换系统的核心)。 Pasqua将分享 10个要点,有助于顺利整合NoSQL系统集成到你的企业。 开发用例 Pasqua认为一个成功的NoSQL项目的第一步是没有秘诀的,你就是需要开发一个坚实的用例和清晰的理解你到底想实现什么。 Pasqua 说“没有NoSQl,公司几乎注定是要失败的。我们已经在大数据领域看到了很多这样的例子。我和人们曾经在会议中讨论过,他们说需要Hadoop,将Hadoop带入企业。他们不确定是为什么或者他们想要试图完成什么,但CIO(首席信息官)就是告诉他们,他们需要Hadoop。只有好运到极大程度才能顺利实现这个要求。他们想要进入大数据的领域,但有时这个愿望真的会妨碍他们理解业务价值的内容。” 对于需要大规模和大量数据的项目,使用NoSQL常常是正确的选择,其具备以下功能:个性化、用户配置文件管理、从运行数据中实时提取信息、内容管理、目录、客户360度视图、移动应用、物联网应用、数字通信和欺诈检测。 承认NoSQL是颠覆性的 如果你决定在你的业务基础建设里实现NoSQL你就必须要承认,——开始计划——它将产生一种颠覆性的力量。 Pasqua 说:“NoSQL是具有颠覆性的,它的颠覆性体现在许多方面。从开发人员的角度来看,人们希望使用已有的工具和技术。即使他们决定想要做一些不一样的事情,他们会形成一个关于如何构建应用程序和使用数据库的整体思维。很自然地,他们会试图采用这个经验,尝试让NoSQL以同样的方式工作。但是它没有。他们尝试将NoSQL像SQL一样使用,最终两边都做不好。你需要退后一步,考虑实际使用NoSQL的正确方式。不要试图改变它,使它成为一个关系数据库。这是一个新的模型,这是一个颠覆性的模型,我们要学会利用它。” Pasqua说,例如,传统的经验法则是,你的任何一个应用程序都必须要有一大批数据库管理员(DBA)。但他指出,在NoSQL的世界中,他只会看到一个数据库管理员,可能在过去是10个。你可以不需要这些员工,将他们应用到别的方面。成本模型,也将会改变。NoSQL就是一个基于硬件技术的扩展,商品。 Pasqua 说“你购买我们的方式,使用我们的方式,是非常不同的, 你可以买到很划算的硬件和令其发展为你所需要的样子。这真的影响到采购流程。你无须提前购买1000万美元或2000万美元的硬件,它会允许你通过采购周期很快的移动。在这方面做得很好的人善于利用这一点。” 确定NoSQL模型如何符合现有的数据库 一旦你已经明白你的用例,你就可以确定NoSQL是否适合你的项目。它可能是你的团队已经熟悉的已有工具,他们对此抱有期待。但Pasqua警告(反对),不要试图强迫方钉钉入圆孔中。 Pasqua说:“我们在商业中看到很多这样的情况。他们会找出他们的用例,而且知道他们想要完成什么。然后他们会说,‘让我来做吧,我们有现成的工具和技术’。对于大量的项目而言,特别是那些要求大数据和数据灵活性的项目而言,他们经常发现手中已有的工具不能工作。有时候他们还是会使用这些工具好几年直到他们认清事实:这些工具不能工作。” 这是Healthcare.gov崩溃的其中一个原因。Pasqua说,服务最初是建立在Oracle数据库上,但是一个严格的底层数据模式的需求会给系统带来巨大的压力。所需的用例要求NoSQL具备敏捷性。Mark Logic作为其中一个供应商能为他们提供帮助。Pasqua补充道“当这些工具不适合或者NoSQL更适合解决你的问题时, 能分清这些状况真的很重要”。 确认企业中的决策者和执行者 这不是NoSQL的唯一性。当处理颠覆性改变,改变管理才可能是你的面对的最大障碍。 Pasqua 说“没有决策者,你会一事无成,但是你的团队中也必须有实现者。” 实现具体的细节可以实现甚至打破你的初衷,所以在你的团队中有把技术发挥到位的人,可以实现所有的改变。 从小事做起,然后逐渐提升 从相关小技术做起是很困难的。如果你是一个大公司,那么你已经拥有成百上千的客户,他们可能是个人也有可能是企业,你将会频繁的遇到许多关于数据的不同政策的挑战,或者整合其他公司你所要求的数据。 Pasqua说:“把不同的数据孤岛的数据集中到一起是一件大工程,而且数据量每天都在增长。” 使用相关技术解决这些数据孤岛问题意味着:你必须从你要集中的数据中分清所有不同的数据孤岛, 创建一个协调数据的模式,并开发和部署的ETL过程把所有数据集中在一起。这个过程可能需要几个月甚至更长时间。 他说:“就像你看到隧道尽头的光,你创建了一个新的产品或收购一家新公司或新的处理控制请求,你就回到了起点,你必须要提前建好所有的数据模型。” 他说,NoSQL的扩展性,基于商品的结构和模式的灵活性意味着你可以从小规模的数据开始,但是你必须要很努力。你可以从混乱,非结构化的数据开始,从它的正确方式获得价值,然后必要的随着时间添加结构数据。 明确你是否拥有正确的技能 Pasqua说:“拥有修改应用程序的设计过程和系统应用程序体系结的技能是很关键的,这有助于实现NoSQl。” “拥有合适的技能是至关重要的,”他说。“这并不是说NoSQL很复杂。事实上,它通常更加简单,但是它是不同的。许多人已经在数据库业务上工作了30年,他们曾经使用过的唯一数据库是关系数据库。所以学习NoSQL他们没有任何麻烦,但真的需要时间。” 培训是流程的一个至关重要部分。Pasqua提到Mark Logic现在提供所有的免费培训,不管你是否是客户。 明确约束和使用主动权的流程 必要的,你要反复思考你在NoSQL世界的流程。惯性可能是你最大的约束之一。 他说:“目前的现状可以看出,他们一直使用同样的方法,顺从自己内心渴望去做这些事情 .” 通过新的技术理解你的用例和颠覆性改变,可以让你评估你的流程,更好的利用新的能力。关键的架构师和技术领导者会帮助你塑造这些流程,团结他们的企业。 形成紧迫感 帮助所有利益相关者了解您的NoSQL实现的需求以及了解他们期待获得什么样的回报。 如果你发展NoSQL,你的挑战就是有些人已经面临最后的底线和看不到未来的方向。 “通常这些人的问题是关于大数据和数据集成的,他们抓破脑袋,使用手中的工具想去解决问题,并且已经花费了很多时间,” Pasqua说。“因为他们花费很多时间在这个问题上所以他们遭受着时间的压力,但是结果还是走进了死胡同。我们看到的这些挑战形成的紧张感笼罩着这些人。” 这可能是商业中以业务为导向或者以管理为导向的最后期限,这些底限笼罩着人们。Pasqua 说,你要确保你的技术人员和负责采购的人员对最后期限有足够的紧迫感。“从小事做起,然后逐渐增加,并将其传递给所有的利益相关者。” 非结构化数据库的数据库管理(NoSQL DBMS)和查询语言的估计理解 评估你的组织对NoSQL的理解和如何使用。 “你的人已经是‘智能数据库人’,”帕斯瓜说。“他们理解NoSQL不会有任何麻烦。从技术方法上这不是一个不可逾越的问题。它更多的是文化问题。” 依靠经验,包括来自同行和顾问的 经验改变一切。 “因为像Mark Logic这样的技术真的很棒,但是它很容易令人走入陷阱,所以要能走出去,和那些使用这些技术并真正从中受益的人进行网络交流和一起工作是非常重要的。如果某人正在使用Mark Logic,他们利用它来运作银行或者作为他们训练系统的一部分。 Healthcare.gov正使用它来运行exchange。最棒的事情是你可以走出去和那些使用的人交流。从技术,文化以及流程方面和他们交流,找到如何在你的企业中使用这些技术,从而实现利益最大化。” 如果你要引入第三方顾问,应该寻找专业的结构化服务,能够引入工程师和顾问,令你的人处于有利的地位。这比单纯的专业服务更加独立,能够一直伴随企业的发展。
|