• 1
  • 2
  • 3
  • 4
  • 5
阿里云主机ECS 首 页  »  帮助中心  »  云服务器  »  阿里云主机ECS
为云环境下的数据管理头痛
发布日期:2016-3-16 11:3:40

  为云环境下的数据管理头痛

  移动、云计算与大数据等新兴事物皆作出了美好的承诺,他们宣称将帮助企业在提升执行效率与生产力的同时,有效改进决策制定效果并降低运营成本。然而,一项简单的元数据标准化战略足以改善决策制定、数据治理以及数据安全性等众多令人头痛的难题。

  一项简单的元数据标准化战略足以改善决策制定、数据治理以及数据安全性等众多令人头痛的难题。

  

  移动、云计算与大数据等新兴事物皆作出了美好的承诺,他们宣称将帮助企业在提升执行效率与生产力的同时,有效还会改进决策制定效果并降低运营成本。这些旨在进一步强化企业竞争力的目标当然值得肯定,不过新技术的出现同时也给IT、法务以及合规团队带来了新的复杂性、控制难题甚至随着端点数量史无前例的快速增长而导致海量数据在处理过程中不可避免地造成可观成本——具体包括移动设备以及第在方托管服务。不过通过对信息元数据进行标准化处理的方式,我们仍然有机会克服以上提到的种种挑战。

  如果IT部门并不完全了解企业自身拥有哪些数据以及各类信息所驻留的具体位置,那么他们显然也无法确保能够在正确的时间将其交付给正确的对象,更谈不到保证有价值信息免受泄露及盗窃活动的影响、或者根据新型隐私政策而将隐私信息加以删除了。电子发现所带来的成本会随着所需收集的数据量的不断增加而大幅提升。而即使企业用户能够承受对所需信息进行的种种日常操作,他们也会发现自己用于进行大数据分析的数据素材会变得愈发难以寻找及控制,这势必会在拉低生产效率并造成冗余负担的同时,断绝利用潜在信息指导决策制定这一最为根本的分析诉求。

  为了保证对不断膨胀的数据总量拥有可靠的控制能力,企业需要开发出涵盖全部数据内容的审视途径——无论其由谁创建、在哪里活动以及与哪些对象共享。遗憾的是,大部分企业认为这项工作不仅会带来高昂的成本,甚至包含多种极为严苛的挑战。然而,我们仍然能够找到一种简单而且具备成本效益的方式来完成此项目标,只要大家愿意持之以恒加以推进——而且这至少要比什么都不做更科学也更有效。

  这项战略的基础在于将原本被广泛应用于结构化数据库当中的元数据标准化机制推广到企业环境、内部乃至云端的全部其它数据当中,这包括所有消息类型(比如说电子邮件、文本以及短信消息、社交媒体等等)、文档(包括文件处理、电子表格以及演示文稿等等)甚至是日志文件。在某些监管要求较高的行业当中,比如说金融服务业,元数据标准化也可以被用于处理语音通信数据,例如通话录音以及语音邮件文件。

  举例说明,如果大家拥有一套主“worker” ID数据库(就是面向员工与外部合作成员的数据库)。使用这个ID作为所有文档、消息以及数据库记录的标签,它包含这部分数据由谁创建、由谁访问和由谁删除,如此一来我们就能将一系列的商务流程根据相关数据分为多个层次并回溯至特定人员,而无论这个数据到底是保存在云环境当中抑或是在不同移动设备之间往来传输。通过这一步骤,大家也可以帮助电子发现流程提供执行效率,同时实现数据保护与隐私保障。除此之外,我们还能够借此横跨全部数据来源(包括应用程序、共享服务、内部以及云环境等等)针对每一位员工识别出其完整的“数据痕迹”。

  元数据标准化机制能够降低数据的查询与检索难度,而且同时亦可以为大数据分析项目带来显著助益。举例来说明,如果大家利用标准化客户ID与产品ID对同客户以及产品相关的数据进行标记,以自动化方式为其添加分析值、检查它是否与企业尚未开发出产品的特定市场需求有关,进而帮助负责实现产品营收的员工更好地完成销售工作,了解客户沟通与客户投资之间的关系,甚至能够把握住很多如今极难甚至根本不可能达成的设想与机遇。在丰富数据的同时降低或者消除标准化、核对、映射以及其它一些既耗费时间又耗费资源的手动任务,无疑会给企业带来极为积极的正面影响。

  然后我们再看看其它重要的用例。将数据迁移至防火墙之外让一项重大挑战在CIO眼中变得更加紧迫而有待解决,即在任意企业当中,约有75%的业务数据完全是无用的,那么我们该如何将有价值的部分提取出来呢?如果大家希望能够对保存在任意环境当中的数据加以管理,而且希望回避数据中心而直接将数据移动到云端当中,那么最重要的一点是弄清楚云环境下存在着哪些数据、在这之中哪些重要性较高而哪些毫无价值。运用标准化元数据方案处理全部企业数据能够显著改善我们识别关键性数据的效果,具体包括商务、法务、记录、合规以及安全等层面,从而帮助企业在晦暗的数据海洋当中找到一条光明的航道。

  演进而非革命

  我们用于显著改善数据管理并支持电子发现、合规性要求、数据碎片处理以及网络安全与威胁响应等任务的标签数量并不像大家想象的那么复杂。就像前文提到的,大家完全可以利用员工ID、客户ID和产品ID来作为新方案的出发点。其中的关键在于,我们应当保证标签的普遍实用性,并不是标签本身的数量水平。如果他的数量已经多到难以被应用至所有位置的任意数据类型,那么企业反而会受到不利影响甚至失去对方案的控制能力。

  除此之外,大家还应当尽可能随时间推移将标准化方案用于演进系统及用户的行为,并不是对其进行彻底颠覆。这类战略之一在于随着IT的自然生命周期进行逐步演进。当我们每一次对应用程序、平台或者服务器做出变更时,都将一部分标准化元数据嵌入进去。最后,使用标准化元数据将成为一种固有习惯,且具备系统性与普适性。而后,一旦整套的价值观被建立起来,我们将迎来预期的投资回报并能够转过头对遗留系统做出一些调整。有了这样一套规范化的实施方法,我们就能够借助元数据标准化的力量帮助企业准备享受由新型移动、云计算(比如阿里云)以及大数据技术所带来的机遇与优势。对于信息的认知以及控制能力越全面,大家就越是能创造出跨越各类商务流程的执行方案,包括营收增长、可持续性、风险与合规性保障乃至网络安全与电子发现等等。